Zahlenspiele bei Wikipedia

Vor kurzem bin ich auf der Suche nach einem Wort (Dienoraštis) in einer mir unbekannten (vermutlich baltischen) Sprache auf den Artikel Wikipedia:Sprachen gestoßen. Dort steht, in welchen Sprachen es die Wikipedia gibt. Außerdem sind die vorhandenen und die noch fehlenden Sprachversionen der Wikipedia dort nach allen möglichen Kriterien sortiert.

Was mich sehr erstaunt hat, ist die Liste der 10 größten Wikipedias, also der Wikipedias mit den meisten Artikeln. Welches die größte Wikipedia ist, liegt nahe: die Englische mit 5.117.658 Artikeln. Aber schon bei der zweiten wird es unerwartet. Das ist nämlich keine der „großen“ Sprachen der Welt, sondern Schwedisch mit 2.886.166 Artikeln. 330 Millionen Menschen sprechen Englisch als Muttersprache (mit Zweitsprachlern kommt man auf eine halbe bis anderthalb Milliarden Sprecher), etwa 10,5 Millionen sprechen Schwedisch.

Richtig erstaunlich finde ich den dritten Platz. Den hält Cebuano, eine mit 18 Millionen Sprechern auch nicht gar so große malayo-polynesische Sprache, die auf den Philippinen gesprochen wird. Es gibt 2.116.237 Artikel auf Cebuano. An neunter Stelle steht übrigens das mit dem Cebuano verwandte Wáray-Wáray, das ebenfalls auf den Philippinen gesprochen wird, mit 1.259.515 Artikeln.

Nach Cebuano kommt dann das Deutsche mit 1.925.541 Artikeln, dicht gefolgt vom Niederländischen mit 1.862.412 Artikeln. Dann kommen Französisch (1.740.934 Artikel), deutlich abgeschlagen Russisch (1.300.623), Italienisch (1.263.216), das bereits erwähnte Wáray-Wáray und an zehnter Stelle dann Spanisch mit 1.248.217 Artikeln.

Genauso interessant ist die Zahl der aktiven Nutzer. Die englischsprachige Wikipedia hat 132.030 aktive Nutzer. Die deutschsprachige immerhin 20.322, die anderen europäischen Sprachen stehen ähnlich da: Schwedisch, Niederländisch, Französisch, Russisch, Spanisch. Soweit so unaufregend. Die beiden philippinischen Wikipedias fallen umso mehr auf: Auf Cebuano schreiben ganze 105 aktive Nutzer, auf Wáray-Wáray 82. Die haben mit 20.156 (Cebuano) und 15.360 (Wáray-Wáray) Artikeln pro Kopf ein ganz ansehnliches Stück Arbeit hingelegt.

Die englischsprachigen aktiven Benutzer haben gerademal einen Schnitt von 39 Artikeln pro Kopf geschafft, die deutschsprachigen 95, die niederländischsprachigen immerhin 446 und die schwedischsprachigen 981. Trotzdem eine riesige Lücke. Sind das auf den Philippinen Hauptamtliche? Oder sind das Sammel-User, wo sich ganze Gruppen von Leuten unter demselben Namen anmelden, sodass unter so einem Benutzernamen viel mehr geschrieben werden kann als anderswo? Keine Ahnung.

Dienoraštis ist übrigens Litauisch und bedeutet Tagebuch.

Advertisements

6 Kommentare on “Zahlenspiele bei Wikipedia”

  1. Achim sagt:

    Die schwedische Wikipedia wird von einem Bot mit so vielen Artikeln gefüllt, dass es neben der Option „Zufälliger Artikel“ („Slumpartikel“) noch die Option „-bot“ gibt. Und auf der Bot-Seite steht zudem, wie ich gerade nachlese: „Roboten är även aktiv på de filippinska språken Cebuano och Waray-waray, och har skapat majoriteten av de wikipediaartiklar som finns på dessa språk.“ (Der Bot ist auch in den philippinischen Sprachen Cebuano und Waray-waray aktiv und hat die Mehrheit der Wikipedia-Artikel in diesen beiden Sprachen verfasst.)

    Da hat jemand vor, WP in Sachen Pilze und Vögel vollständig zu machen… oder so.

    Gefällt mir

  2. gnaddrig sagt:

    Ah, das leuchtet ein. Da wundert mich nur, dass man das bei Wikipedia duldet. Gut, der Macher des Bots ist selbst Admin bei der schwedischsprachigen Wikipedia, der darf offensichtlich. Aber was soll das bringen? Eine Auflistung von Pilzen, Vögeln und Insekten zu hunderttausenden Stumps in Wikipedia zu verwursten kommt mir wenig sinnvoll vor und bläht die Wikipedia nur mit (für praktisch alle Nutzer) irrelevanten Artikeln auf.

    Da ich kein Schwedisch kann, kann ich auch die Qualität der botgenerierten Texte nicht beurteilen. Aber wenn da bisher niemand was gegen unternommen hat, müssen die einigermaßen tolerabel sein. Insofern ein faszinierendes Experiment. Immerhin Ist Herr Johansson ja Sprachwissenschaftler.

    Der andere auffällige Ausreißer, die niederländische Sprachversion, ist anscheinend auch per Bot aufgepumpt worden. Besonders sinnvoll finde ich die dabei entstandenen 35.000 Artikel über französische Gemeinden.

    Im Lichte dieser Erkenntnnisse sollte ich meinen Artikel vielleicht umbenennen in Die Bot-Kriege oder so…

    Gefällt mir

  3. Achim sagt:

    Dagegen hat wahrscheinlich niemand was unternommen, weil es die Zufallssuche mit „-bot“ Parameter gibt und man sich den Müll vom Hals halten kann.

    Und der Herr ist eher Paläoanthropologe als Sprachwissenschaftler – wenn man sich seine Publikationen anschaut.

    Gefällt mir

  4. gnaddrig sagt:

    Das erklärt dann die Wahl der Futterquelle für den Bot.

    Gefällt mir

  5. aurorula a. sagt:

    Wer solche Zahlenspiele mag, dem gefällt bestimmt auch:

    http://www.worldmapper.org/

    Diese Seite stellt die Welt als Tortendiagramm dar: je mehr x – Bevölkerung, Computer, Milchwirtschaft… – es in einem Land gibt, umso größer ist es auf der Karte zu sehen. Ganz lustig für einen Wikiwalk oder als Kunst 🙂

    Daß die chinesische Wikipedia nicht größer ist, überrascht mich dann doch. Hätte ich nie gedacht.

    Gefällt mir

  6. gnaddrig sagt:

    Witzig, die Karten. Als Illustration der einen oder anderen Kennzahl oder als Einstieg in Vorträge sicher auch nützlich. Muss ich mal ein bisschen drin rumstöbern.

    Vielleicht gibt es eine einheimische Konkurrenz zur chinesischen Wikipedia? Oder die Regierung sieht das nicht so gern und unterbindet entsprechende Aktivitäten? Oder man interessiert sich dort einfach nicht so für enzyklopädische Unternehmungen, keine Ahnung.

    Gefällt 1 Person


In den Wald hineinrufen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s