Grund- u. Kernwortschatz

 

Die Darstellung modelliert – grob und sehr vereinfacht – den Wortschatz (Diaregister) einer Sprache X nach Häufigkeitsmerkmalen. Sie verzerrt insoweit, als die Proportionen der einzelnen Register nicht ihrem realen Anteil am Diaregister bzw. der Gesamtsprache entsprechen. So gehören dem exzentralen Register die Fachwortschätze an, deren Umfang etwa im Fall der Medizin den des zentralen Wortschatzes weit übersteigt. Geschuldet ist dies z.T. der Monosemierung, d.h. dem Grundsatz „ein Signifikant-eine Bedeutung“. Die für den KRM relevante Komputation des Wortschatzes folgt allein dem Prinzip „Frequenz einer lemmatisierten Wortform über eine hinlängliche Registeranzahl hinweg“. Damit ein Wort z.B. im internationalen Wortschatz des Spanischen aufgenommen wird, genügt es nicht, dessen Okkurrenzen bzw. Vorkommen etwa allein in Valparaíso (Chile) zu zählen, sondern auch etwa in Havanna, Buenos Aires, Caracas, im auch spanischsprachigen New York oder Cádiz und Las Palmas sowie andernorts – und zwar getrennt nach den Registern des Sprechens und des Schreibens. Neben regionalen (diatopischen) Varietäten spielen soziale (diastratische) eine Rolle. Substandardliche Formen finden dann ihren Platz, wenn sie neben den Häufigkeitskriterien auch solche der Verbreitung (Dispersion) erfüllen.

Der KRM umfasst den Kern des zentralen Wortschatzes der vier romanischen Zielsprachen. Er führt die Wörter in Serien zusammen, die überall im Alltag der entsprechenden Kulturen begegnen, dies sind auch diejenigen Vokabeln, die man selbst ständig braucht, wenn man in dieser Sprache rezeptiv oder produktiv kommuniziert.

Die folgende Datei erklärt die Entwicklung des Grundwortschatzes innerhalb des MIRIADI-Projekts bis zur Fertigstellung des Kernwortschatzes der romanischen Mehrsprachigkeit.

Projektbeschreibung-Rueckblick190711

Facebooktwitterredditpinterestlinkedinmail