Kernwortschatz der romanischen Mehrsprachigkeit (KRM)

Adressatenkreis: Forschung und akademische Lehre

Beschreibung des KRM

Der Kernwortschatz der romanischen Mehrsprachigkeit (KRM) ist eine geschützte, mehrsprachige relationale Datenbank. Sie verzeichnet auf der Grundlage umfangreicher computerlinguistischer Daten die 5000 ranghäufigsten Wörter der jeweiligen Zielsprache Französisch, Italienisch, Portugiesisch und Spanisch. Die französischen, italienischen, portugiesischen und spanischen Lemmata  sind nach ihren gemeinsamen Bedeutungskernen mit ihren deutschen und englischen Entsprechungen in 9550 Serien zusammengestellt. Jede Serie ist mit einer Anzahl von pädagogischen und lexikographischen Markern versehen, die eine spontane (elektronische) Zusammenstellung von Serien und Wörtern nach pädagogischen oder lexikologischen Kriterien der Nutzer erlauben. Daneben ist sind die Serien nach Frequenzintervallen (<2000, <5000, 7000 [nur Italienisch]) und Transparenzstufen (T0 [seriell gänzlich opak] bis T5 [seriell gänzlich transparent]) versehen. Beispiele zur seriellen Transparenz: anticiper-anticipare-antecipar-anticipar-to anticipate-antizipieren bzw. zur vollständigen Undurchsichtigkeit: chaise-sedia-assento-silla-chair-Stuhl, oder der partiellen: boire-bere-beber-beber-to drink bzw. attraper-acchiappare-apanhar-atrapar-to catch. Die Klassifizierung erlaubt natürlich Zusammenstellungen von Serien nach den lernleistungsbezogenen Kriterien transferabel (leicht, da schon vorbekannt) und undurchsichtig (schwer, da in allen Teilen des Wortes – Graphie, Bedeutungskern, im Vergleich des neuen zu den schon bekannten Schemata hinzuzulernen).

Das aus einem Grundwortschatz (Frequenzrang <2000) und Kernwortschatz (<5000 bzw. 7000) gebildete lexikalische Inventar des Kernwortschatzes lässt sich nach unterschiedlichen, pädagogisch relevanten Kriterien aufteilen, wie das folgende Schaubild zeigt.

Metalexikographische Einordnung

Als kernwortschatzliches Corpus gehört der KRM in die Gruppe der sprachlichen Minimalwörterlisten – wie etwa das BASIC-English, das Français Fondamental oder die sog. Grundwortschätze. Als Alleinstellungsmerkmale des KRM begegnen

  • eine siebensprachige Datenbank (bestehend aus den vier Zielsprachen, Deutsch und Englisch sowie den Eintragungen in einer Rubrik ‚Etyma‘),
  • die Anordnung der Lemmata in Serien unter einem gemeinsamen Bedeutungskern,
  •  die Kategorisierung der Serien nach Transparenzklassen.

Die Selektoren erlauben ad hoc-Komputationen, welche auf Fragen antworten, die in der (deutschsprachigen) Fremdsprachendidaktik seit Jahren (Jahrzehnten) diskutiert werden. Stichworte:

  • für die schulische Grundlegung von Mehrsprachigkeit optimale Sprachenfolgen,
  • sprachenübergreifendes, mögliche Synergien nutzendes Lehren und Lernen von Sprachen,
  • integratives Sprachenlernen,

Selektionskriterien für die Erstellung des Inventars waren erstrangig der Frequenzrang, zweitrangig die Kategorisierung nach interlingualer Transparenz/Opazität in vier Intervallstufen; hinzu kamen die Charakterisierung der Serien und Lemmata nach linguistisch und pädagogisch relevanten Selektoren.

Das lexikalische Inventar des KRM wurde auf der Grundlage der Frequenzwörterbücher des Routledge Verlages, ergänzt durch die Grundwortschätze des Klett-Verlages kompiliert. Es sortiert die mehrsprachigen Serien nach Frequenzklassen und Transparenzintervallen. Dies betrifft sowohl den Grundwortschatz (GRM) mit dem Frequenzrang-Intervall <2000 als auch den umfassenderen Kernwortschatz (KRM) und dem Intervall <5000. Eine Vielzahl von Selektoren erlaubt, wie gesagt, die ad hoc-Zusammenstellung von bestimmten Vokabelgruppen, etwa zu gezielten Übungszwecken und Aufgaben – ganz nach den Bedürfnissen der Lernerinnen und Lerner.

Was die Konstruktion eines mehrsprachigen Kernwortschatzes (CVRP/KRM) betrifft, so weist diese neue Wege auf. Die Lernapps erlauben im Prinzip auch die Erfassung von Daten zum Lernverhalten und zur ‘usability’, so dass das Projekt neben seiner lernpraktischen Ausrichtung auch Fragen der Lern- und Lernerforschung umgreift.

Lexikographische Grundlagen:

Davies, Mark (2006): A Frequency Dictionary of Spanish. Core vocabulary for learners. New York/London: Routledge.
Davies, Mark & Gardner, Dee (2010): Frequency Dictionary of Contemporary American English. Word sketches, collocates, and thematic lists. New York/London: Routledge.
Davies, Mark & Preto-Bay, Ana Maria (2007): A Frequency Dictionary of Portuguese. Core vocabulary for learners. London/New York: Routledge.
De Mauro, Tullio; Mancini, Federico; Vedovelli, Massimo; Voghera, Miriam (1993): Lessico di frequenza dell’italiano parlato (LFIP). Prefazione di Pierluigi Ridolfi. S.l.: ETASLIBRI.
Jones, Randall & Tschirner, E. (2006): A Frequency Dictionary of German. Core vocabulary for learners. New York/London: Routledge.
Lonsdale, Deryle & Le Bras, Yvon (2009): A Frequency Dictionary of French. Core vocabulary for learners. New York/London: Routledge.

Amorim-Braun, Maria Luisa (1996): Grund- und Aufbauwortschatz Portugiesisch. Stuttgart: Klett.
Giovanelli, Paolo (1971): Grund- und Aufbauwortschatz Italienisch. Stuttgart: Klett.
Heupel, Carl (1966): Grund- und Aufbauwortschatz Spanisch. Klett (zahlreiche weitere Aufl.).
Nickolaus, Günter (1967): Grund- und Aufbauwortschatz Französisch. Stuttgart: Klett.

Der KRM als Instrument der lexikodidaktischen Forschung

Zumindest seit den frühen Publikationen von Thorndike & Woodworth (1901) und weiteren lässt sich der pädagogische Gemeinplatz zurückverfolgen, demzufolge Lernern schon bekannte zwischensprachliche Analogien (in der Terminologie der Interkomprehensionsdidaktik „Transferbasen“) eine Lernerleichterung bewirken, aber auch vor allem formale Gleichheiten auch zu fehlerträchtigen Interferenzen („falschen Freunden“) führen können. Dass eine über weite Strecken ’naive‘ – weil ohne hinreichende Lernerdaten operierende und zudem gegenüber der Empirie der interkulturellen sprachlich-performanzbezogenen Dialogforschung weitgehend unsensiblen – Fremdsprachendidaktik die ‚Interferenz‘ und den formal-sprachlichen ‚Fehler‘ übermäßig betonte und in der Fehlerprophylaxe dennoch weit hinter der Interkomprehensionsdidaktik zurückblieb, gehört zu den gravierenden Fehlern der didaktischen Steuerung. In der Tat sind die ‚guten‘ Freunde weitaus zahlreicher als die ‚falschen‘ (vgl. Gauger & Cartagena 1989, II, 581-615). – U.a. fehlte im Bereich der Wortschatzdidaktik eine kontrollierbare inputbezogene Inventarisierung, die in vergleichbarer Weise die Wortschätze großer Fremdsprachen umfasst. Hier füllt der KRM eine Lücke, zumindest auf dem Feld der sprachlichen Minimallisten romanischer Zielsprachen. So erlaubt er sowohl die Identifizierung interlingual transparenter Wortentsprechungen als auch deren Organisation zu Lernzwecken und Quantifikationen nach Transparenzklassen und Sprachenkontrasten (Meißner 2022).

Aufgrund der pädagogischen Intention von EuroComDidact seien bereits hier die wichtigsten Eckdaten bzgl. eines möglichen Lernaufwandes (Menge von sog. Transferbasen) bei bestimmten Vorkenntnissen erwähnt: Völlige serielle Transparenz zwischen den vier Zielsprachen zeigen 5618 (59%) Serien; davon beträgt die Teilmenge zu Transparenz Englisch-Romanisch 4361 (46%); völlige serielle Intransparenz 849 (9%). Die Daten beziehen sich auf die Gesamtzahl der Serien (9550). Auch die gemischten Serien zeigen ein massives Übergewicht zugunsten der Transparenzen. – Die Zahlen erklären mit Blick auf das Sprachenwissen, warum und in welchem Umfang es immer leichter fällt, Sprachen ‚hinzuzulernen‘.

Eine eingehende Beschreibung der der App zugrunde liegenden Datenbank und ihrer Konstruktion finden Sie hier. Das Buch wendet sich an Expertinnen und Experten. Beschrieben werden Fragen zur Kompositition mehrsprachiger didaktischer Wortschätze. Vgl. auch die pdf-Datei Short presentation of the Core Vocabulary of Romance Plurilingualism:
Shortpres_CVRP_E_ToGo210510.

Literatur

Cartagena, N. & Gauger, H.-M. (1989): Vergleichende Grammatik Spanisch-Deutsch. Mannheim/Wien/Zürich, Duden, 2 Bde.
Meißner, F.-J. (2016): Der Kernwortschatz der romanischen Mehrsprachigkeit (KRM). Didaktische, lexikologische, lexikographische Überlegungen zu Erstellung, Präsentation, Anwendungen einer elektronischen Mehrsprachenwortliste und von Lernapps zur romanischen Mehrsprachigkeit. (GiF:on 7).
Meißner, F.-J. (2018): The ‘Core Vocabulary of Romance Plurilingualism’ (the CVRP-Project). In: Ambrosch-Baroua, Tina & Kropp, Amina & Müller-Lancé, Johannes (Hrsg.): Mehrsprachigkeit und Ökonomie. München: Open Access LMU, 91-106.
Meißner, F.-J. (2022): Measuring the Romance core vocabulary interlingual transfer potential. (Submitted).
Thorndike, E.L. & Woodworth, R. S. (1901): The influence of improvement in one mental function upon the effiency of other functions. In: Psychological Review 8: 247-261, 384-395, 553-564.

Das Video zur Rolle des KRM für die fachsprachliche Ausbildung zeigt Einblicke in die Komposition der Datenbank.

 

Facebooktwitterredditpinterestlinkedinmail