Abstract
Det Internet-baserte leksikonet Wikipedia er en potensielt veldig nyttig informasjonskilde, men det er naturlig å være skeptisk til et leksikon der alle kan gjøre endringer. Flere undersøkelser har vært gjort for å finne ut hvor korrekt innholdet i Wikipedia er, men det store antallet artikler og de kontinuerlige endringene begrenser hvor omfattende denne typen undersøkelse kan være.
For et leksikon er skrivestil et aspekt ved korrekthet, og spesielt for Wikipedia vil en uformell eller lite konsistent skrivestil gi et dårlig inntrykk. Hvis feil som kan rettes av enhver som leser teksten ikke blir fjernet, hvor sannsynlig er det at feil blir rettet i informasjon som bare en ekspert på emnet kan oppdage?
Vi har undersøkt den japanske Wikipedia, fordi japansk er et språk der in dikatorer på høflig og formell tale forekommer veldig eksplisitt, via forskjellige former som det i noen tilfeller er nødvendig å velge mellom når man snakker eller skriver. Spesielt er forskjellen mellom vanlige og høflige former enkle nok å identifisere til at at det kan gjøres med en datamaskin, noe som muliggjør en undersøkelse av all teksten i alle de japanske Wikipedia artiklene.
Ved hjelp av denne framgangsmåten fant vi ut at skrivestilen i Wikipedia er stort sett i tråd med retningslinjene for prosjektet. De unntakene vi undersøkte forekom hovedsakelig i artikler som bare hadde hatt et lite antall endringer og få forskjellige forfattere.
The Internet based encyclopedia Wikipedia is a potentially very useful source of information, but intuitively, it is difficult to have confidence in the quality of an encyclopedia that anyone can modify. Several studies have been made that examine the correctness of a subset of articles, but the huge number of articles and constant changes limit the possible scope of this approach.
For an encyclopedia, one aspect of correctness is writing style, and especially for Wikipedia, an inconsistent writing style would give a bad impression; if errors that can be detected by any native speaker of a language go uncorrected, how likely is it that errors that only a subject expert can detected will be corrected?
We study the Japanese Wikipedia, because Japanese is a language where honorifics processes are very explicit, involving different forms, between which language users in some cases need to choose every time a sentence is uttered or written. Especially the difference between plain and polite forms is sufficiently easy to detect in a sentence for it to be feasible to perform this operation with a computer, allowing examination of all articles in the Japanese Wikipedia.
Using this approach, we find that the writing style of the Japanese Wikipedia is largely consistent with the style guidelines for the project. The examples of different style usage that we identified, and examined, were mainly found in articles that had only had a small number of changes made by a small number of different editors.