Worte, Wörter, Wörterbücher (Teil 1)

Titel des Buches: "Worte, Wörter, Wörterbücher"Unter diesem Titel habe ich zusammen mit einem Kollegen vor vielen, vielen Jahren eine Sammelpublikation zum Thema „Wörterbuch machen“ herausgegeben. Hier und an vielen anderen Stellen haben Kollegen und  ich (z.B. in der Zeitschrift HERMES) darüber nachgedacht, wie man das Entwickeln von Wörterbüchern mit Computern unterstützen und wie die Informationen in Wörterbüchern gegliedert sein müssen, damit sie maschinell verwaltet und abgerufen werden können. All dies ist, wie gesagt schon viel Jahre her. Genauer: in den 1980er und 1990er Jahren. Inzwischen wurden die damaligen Zukunftsvisonen weit übertroffen. Wörterbücher gibt es im Internet frei zugänglich und es soll schon Schüler geben, die sich bei ihren fremdsprachlichen Unterrichts- und Abiturvorbereitungen allein auf www.leo.org verlassen.

Hier möchte ich besonders auf zwei lexikographische Hilfsmittel im Internet hinweisen, die diesen Namen verdienen.
Sie erschließen lexikographische, lexikologische, aber auch grammatische Informationen für alle Menschen, die mit Sprache arbeiten – kostenlos.
Die Informationen in diesen Wort-Datenbanken sind Deskriptionen, das heißt, Sie beziehen sich auf den nachweisbaren Sprachgebrauch. Sie versuchen nicht vermeintlich richtigen Sprachgebrauch zu vorzuschreiben.
Das heißt man erfährt nicht, was richtig oder falsch sei, sondern der Sprachnutzer kann nachschauen, in welcher Gesellschaft er sich befindet, wenn er oder sie ein Wort oder eine Fügung in einer bestimmten Weise benutzt.

Das DWDS – Das Digitale Wörterbuch der deutschen Sprache (www.dwds.de)

liefert Auswertungen aus seinem umfangreichen Kernkorpus.

Die Auswahl der Texte wurde von der Arbeitsgruppe DWDS und Mitgliedern der Berlin-Brandenburgischen Akademie der Wissenschaften begleitet und begutachtet. Ziel war es, dem Ideal der Repräsentativität möglichst nahe zu kommen, und ein lexikographisches Corpus zusammenzustellen, das als ausgewogen und hinreichend groß in Bezug auf den Forschungsgegenstand „deutscher Wortschatz des 20. Jahrhunderts“ bewertet werden kann. Das DWDS-Kerncorpus ist folgendermaßen verteilt:

  • Schöne Literatur (ca. 26%)
  • Journalistische Prosa (ca. 27%)
  • Fachprosa (ca. 22%)
  • (Transkribierte) Texte gesprochener Sprache (ca. 5%)“
  • Gebrauchstexte (ca. 20%)
Außerdem erhält man den entsprechenden Artikel aus dem Wörterbuch der Gegenwartssprache, das unter Lexikographen als eines der besten Wörterbücher der Deutschen gilt. Wobei sich die Bezeichnung „Gegenwartssprache“ auf die Sprache bis 1977 bezieht. Dennoch hat es Maßstäbe für die einsprachige Lexikographie des Deutschen gesetzt.
Die Informationen aus dem Korpus und dem Wörterbuch werden miteinander verknüpft, so dass man sowohl die (typischen) Wortnachbarschaften (aus dem Korpus) als auch semantische Beziehungen der nachgeschlagenen Lexeme (Wörter) erhält.
Das DWDS ist eine Wortdatenbank von hoher Beschreibungsqualität. Eine Wortdatenbank, die sich die o.g. lexikographischen Träumer bereits in den 80er und 90er Jahren gewünscht haben.

Das Wortschatzportal der Universität Leipzig (wortschatz.uni-leipzig.de)

ist ebenfalls eine deskriptive Wort-Datenbank, die die Informationen zur deutschen Lexik aus „öffentlich zugänglichen Quallen automatisch“ erhebt. Außer diesen spärlichen Informationen auf der Startseite erfährt man nicht viel darüber, wie das Korpus zusammengesetzt ist. Die Informationen, die man nach einer Anfrage erhält sind sehr ausführlich und mit den Einträgen in der Datenbank verlinkt. Nicht so schön wie im DWDS, aber dennoch informativ ist der Kollokationsgraph. Dazu gibt es links und Relationen zu anderen Wörtern und Wortgruppen. Sehr hilfreich ist die Einordnung des aufgesuchten Lexems (Wortes) in die Bedeutungsgruppen von Dornseiffs „Deutschen Wortschatz in Sachgruppen“, den es m.E. leider nicht online gibt, die neueste Ausgabe (8.Auflage) gibt es allerdings mit CD-ROM.
Darüber hinaus erhält man im Portal eine Zusammenstellung der Wörter des Tages:
Die »Wörter des Tages« zeigen, welche Begriffe heute besonders aktuell sind. Dazu werden verschiedene Tageszeitungen und Newsdienste täglich ausgewertet. […] Die Aktualität eines Begriffs ergibt sich aus seiner Häufigkeit heute, verglichen mit seiner durchschnittlichen Häufigkeit über längere Zeit hinweg.
So fanden sich, folgerichtig vor und nach der Vorstellungs von Apples iPad, die Wörter AppleMac und iPhone und Apple-Chef bei den Wörtern des Tages am 26.1. und am 27.1.Gerne würde ich erfahren, welche Quellen für das Gesamtkorpus und für die „Wörter des Tages“ ausgewertet werden …
Alles in Allem ist auch das Wortschatzportal der Uni Leipzig und gutes Werkzeug für Spracharbeiter/innen.
Beide vorgestellten lexikalischen Datenbanken sind hervorragende Werkzeuge für jede/n die/der mit Sprache arbeitet. Wenn ich manche Texte lese (online oder in der realen Welt), wünsche ich den Werkzeugen eine größere Bekanntheit und eine intensivere Nutzung.
(… wird fortgesetzt)
Advertisements

„Notizbuch“ Kookkurrenzen, Kollokationen und Anekdoten

Der Notizbuchblog hat die Wortpatenschaft zu dem Wort Notizbuch übernommen. Patenschaften werden -gegen Gebühr- vom Verein Deutsche Sprache vergeben. Notizbuchblog.de wird sich als künftig darum bemühen, das Wort Notizbuch vor dem Aussterben zu bewahren. Nunja. zu den Bemühungen des VDS hatte ich hier ja schon mal was geschrieben. Ob nun das Wort Notizbuch vom Aussterben bedroht ist, so dahin gestellt. Bis zum Wiedererscheinen der Moleskin-Notizbücher, die eine alte Notizbuchkultur tatsächlich wiederbelebt haben, sah es so aus, als würden die Notizbücher selbst aussterben.
Mir scheint es jedenfalls nicht so zu sein, wie der Anglizismenindex des VDS vermutet, dass das Wort Notizbuch durch das englische notebook verdrängt wird. Bei notebook denke ich vielmehr an einen mobilen Computer (was in einer zweiten Bedeutung auch der VDS so sieht). An dieser Stelle sei eine kleine Anekdote erlaubt:

Das Wort notebook für die kleinen tragbaren Computer kannten meine Töchter schon sehr früh, noch bevor sie wirklich englisch sprechen konnten. Irgendwann einmal sahen sie das Wort von mir geschrieben und wunderten sich über die Schreibweise. Sie meinten es müsse doch not book geschrieben werden, da es ja kein Buch sei. Ein Notizbuch (eben notebook) sei es ja ganz sicher nicht.

Ganz bestimmt: trotz der Affinität der Jugend zur englischen Sprache, aussterben werden unsere Wörter deshalb sicher nicht.

Zurück zur Wortpatenschaft, die Notizbuchblog übernommen hat: Als erste Tat zur Rettung des Wortes gibt es einen Artikel mit morphologischen Angaben zum Wort und zu den Kookkurrenzen des Wortes. Diese sind aber ganz außerordentlich vom verwendeten Textkorpus abhängig. Dies erklärt die vom Notizbuchblog festgestellten Merkwürdigkeiten. Ich empfehle das DWDS (Das Digitale Wörberuch der deutschen Sprache des 20. Jh.) als ersten Angang um etwas über das Wort zu erfahren. Es basiert auf der Arbeit der Sprachwissenschaftler der Berliner Akademie der Wissenschaften und war schon in seiner Buchform als Wörterbuch der Gegenwartssprache eines der besten Wörterbücher des deutschen Sprachraumes (vergesst den DUDEN!!). In seiner derzeitigen Fassung ist das DWDS  ein ein Wortinformationssystem in dem Wörterbuchartikel mit Textbeispielen und statistischen Kookurrenzinformationen verknüpft werden.
Befragt man dieses Wortinformationsstem zu Notizbuch, bekommt man allerlei Interessantes heraus. Unter anderem eben auch Kollokationen, die doch etwas klarer sind, als die zitierten Kookkurrenzangaben und die graphisch so dargestellt werden:

Die Graphik ist dem DWDS nach der Suche nach Notizbuch entnommen und gibt die Wortnachbarschaften (Kollokationen) von Notizbuch wieder. Einen Verweis auf das DWDS gibt es auch im Artikel des Notizbuchblog.
Über diese Visualiserung des der Kollokationen hinaus erhält der Nutzer noch eine Menge weiterer sehr nützlicher Informationen zu dieser Lexemfügung (Notiz+Buch). Unter anderem viele  Belege (der registrierte Nutzer: 260; Registrierung kostenlos) des Wortes in echten Kontexten. Eine Fundgrube für jede/n Spracharbeiter/in!
Da die Korpustexte über einen ganzen Zeitraum gesammelt wurden, bekommt man auch Infromationen zur Statistik der gesuchen Wörter. Die Statistik von Notizbuch zeigt, dass die Verwendung von Notizbuch in der Belletristik seit den 20er Jahren des letzten Jahrhunderts stark abgenommen hat, in den 60er Jahren eine Blüte hatte und nun beharrlich abnimmt. In Zeitungstexten und in der „Gebrauchsliteratur“ dagegen nimmt die Verwendung des Wortes wieder zu.
Statistik Notizbuch
Es gibt also noch Grund zur Hoffnung …