Grundwortschatz

 

Die Darstellung modelliert – grob und sehr vereinfacht – den Wortschatz (Diaregister) einer Sprache X. Sie verzerrt insoweit, als die Proportionen der einzelnen Segmente bzw. Register nicht ihrem realen Anteil am Diaregister entsprechen. So gehören dem exzentralen Register große Teile der Fachwortschätze an, deren Umfang etwa im Fall der Medizin den des zentralen Wortschatzes deutlich übersteigt. Geschuldet ist dies z.T. der Monosemierung, d.h. dem Grundsatz „ein Signifikant-eine Bedeutung“. Die Komputation des Wortschatzes folgt allein dem Prinzip „Frequenz einer lemmatisierten Wortform über eine hinlängliche Registeranzahl hinweg“. Damit ein Wort z.B. im internationalen Wortschatz des Spanischen aufgenommen wird, genügt es nicht, die Okkurrenzen etwa allein in Chile zu zählen. Stattdessen sollte es z.B. in Havanna, Buenos Aires, Valparaiso, Caracas, im auch spanischsprachigen New York, Mexico City, Madrid, Las Palmas und andernorts präsent sein, und zwar in den Registern des Sprechens und des Schreibens. Neben regionalen (diatopischen) Varietäten spielen soziale (diastratische) eine Rolle. Substandardliche Formen finden dann ihren Platz, wenn sie neben den Häufigkeitskriterien solche der Dispersion erfüllen.

Der KRM umfasst den Kern des zentralen Wortschatzes der vier romanischen Zielsprachen. Er führt die Wörter zusammen, die überall im Alltag der entsprechenden Kulturen begegnen, dies sind auch diejenigen Vokabeln, die man selbst ständig braucht, wenn man in dieser Sprache rezeptiv oder produktiv kommuniziert.

Die folgende Datei erklärt die Entwicklung des Grundwortschatzes innerhalb des MIRIADI-Projekts bis zur Fertigstellung des Kernwortschatzes der romanischen Mehrsprachigkeit.

Projektbeschreibung-Rueckblick190711

Facebooktwitterredditpinterestlinkedinmail