Worte, Wörter, Wörterbücher (Teil 1)


Titel des Buches: "Worte, Wörter, Wörterbücher"Unter diesem Titel habe ich zusammen mit einem Kollegen vor vielen, vielen Jahren eine Sammelpublikation zum Thema „Wörterbuch machen“ herausgegeben. Hier und an vielen anderen Stellen haben Kollegen und  ich (z.B. in der Zeitschrift HERMES) darüber nachgedacht, wie man das Entwickeln von Wörterbüchern mit Computern unterstützen und wie die Informationen in Wörterbüchern gegliedert sein müssen, damit sie maschinell verwaltet und abgerufen werden können. All dies ist, wie gesagt schon viel Jahre her. Genauer: in den 1980er und 1990er Jahren. Inzwischen wurden die damaligen Zukunftsvisonen weit übertroffen. Wörterbücher gibt es im Internet frei zugänglich und es soll schon Schüler geben, die sich bei ihren fremdsprachlichen Unterrichts- und Abiturvorbereitungen allein auf www.leo.org verlassen.

Hier möchte ich besonders auf zwei lexikographische Hilfsmittel im Internet hinweisen, die diesen Namen verdienen.
Sie erschließen lexikographische, lexikologische, aber auch grammatische Informationen für alle Menschen, die mit Sprache arbeiten – kostenlos.
Die Informationen in diesen Wort-Datenbanken sind Deskriptionen, das heißt, Sie beziehen sich auf den nachweisbaren Sprachgebrauch. Sie versuchen nicht vermeintlich richtigen Sprachgebrauch zu vorzuschreiben.
Das heißt man erfährt nicht, was richtig oder falsch sei, sondern der Sprachnutzer kann nachschauen, in welcher Gesellschaft er sich befindet, wenn er oder sie ein Wort oder eine Fügung in einer bestimmten Weise benutzt.

Das DWDS – Das Digitale Wörterbuch der deutschen Sprache (www.dwds.de)

liefert Auswertungen aus seinem umfangreichen Kernkorpus.

Die Auswahl der Texte wurde von der Arbeitsgruppe DWDS und Mitgliedern der Berlin-Brandenburgischen Akademie der Wissenschaften begleitet und begutachtet. Ziel war es, dem Ideal der Repräsentativität möglichst nahe zu kommen, und ein lexikographisches Corpus zusammenzustellen, das als ausgewogen und hinreichend groß in Bezug auf den Forschungsgegenstand „deutscher Wortschatz des 20. Jahrhunderts“ bewertet werden kann. Das DWDS-Kerncorpus ist folgendermaßen verteilt:

  • Schöne Literatur (ca. 26%)
  • Journalistische Prosa (ca. 27%)
  • Fachprosa (ca. 22%)
  • (Transkribierte) Texte gesprochener Sprache (ca. 5%)“
  • Gebrauchstexte (ca. 20%)
Außerdem erhält man den entsprechenden Artikel aus dem Wörterbuch der Gegenwartssprache, das unter Lexikographen als eines der besten Wörterbücher der Deutschen gilt. Wobei sich die Bezeichnung „Gegenwartssprache“ auf die Sprache bis 1977 bezieht. Dennoch hat es Maßstäbe für die einsprachige Lexikographie des Deutschen gesetzt.
Die Informationen aus dem Korpus und dem Wörterbuch werden miteinander verknüpft, so dass man sowohl die (typischen) Wortnachbarschaften (aus dem Korpus) als auch semantische Beziehungen der nachgeschlagenen Lexeme (Wörter) erhält.
Das DWDS ist eine Wortdatenbank von hoher Beschreibungsqualität. Eine Wortdatenbank, die sich die o.g. lexikographischen Träumer bereits in den 80er und 90er Jahren gewünscht haben.

Das Wortschatzportal der Universität Leipzig (wortschatz.uni-leipzig.de)

ist ebenfalls eine deskriptive Wort-Datenbank, die die Informationen zur deutschen Lexik aus „öffentlich zugänglichen Quallen automatisch“ erhebt. Außer diesen spärlichen Informationen auf der Startseite erfährt man nicht viel darüber, wie das Korpus zusammengesetzt ist. Die Informationen, die man nach einer Anfrage erhält sind sehr ausführlich und mit den Einträgen in der Datenbank verlinkt. Nicht so schön wie im DWDS, aber dennoch informativ ist der Kollokationsgraph. Dazu gibt es links und Relationen zu anderen Wörtern und Wortgruppen. Sehr hilfreich ist die Einordnung des aufgesuchten Lexems (Wortes) in die Bedeutungsgruppen von Dornseiffs „Deutschen Wortschatz in Sachgruppen“, den es m.E. leider nicht online gibt, die neueste Ausgabe (8.Auflage) gibt es allerdings mit CD-ROM.
Darüber hinaus erhält man im Portal eine Zusammenstellung der Wörter des Tages:
Die »Wörter des Tages« zeigen, welche Begriffe heute besonders aktuell sind. Dazu werden verschiedene Tageszeitungen und Newsdienste täglich ausgewertet. […] Die Aktualität eines Begriffs ergibt sich aus seiner Häufigkeit heute, verglichen mit seiner durchschnittlichen Häufigkeit über längere Zeit hinweg.
So fanden sich, folgerichtig vor und nach der Vorstellungs von Apples iPad, die Wörter AppleMac und iPhone und Apple-Chef bei den Wörtern des Tages am 26.1. und am 27.1.Gerne würde ich erfahren, welche Quellen für das Gesamtkorpus und für die „Wörter des Tages“ ausgewertet werden …
Alles in Allem ist auch das Wortschatzportal der Uni Leipzig und gutes Werkzeug für Spracharbeiter/innen.
Beide vorgestellten lexikalischen Datenbanken sind hervorragende Werkzeuge für jede/n die/der mit Sprache arbeitet. Wenn ich manche Texte lese (online oder in der realen Welt), wünsche ich den Werkzeugen eine größere Bekanntheit und eine intensivere Nutzung.
(… wird fortgesetzt)

Eine Antwort

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: