Den Fachleuten aufs Maul schauen – Wortschatzanalysen mit Pivot-Tabellen

‘Dem Volk aufs Maul zu schauen’ ist ein Rat von Martin Luther. Sein Zitat stammt aus dem „Sendbrief vom Dolmetschen“. Der Rest der Überschrift benennt das digitale Analyse-Werkzeug, um viele gesprochene Worte aus dem Mund von Fachleuten zu analysieren und auszuwerten. Wer Excel nutzt kann an dieser Stelle die zugehörige Analysemappe herunterladen: https://konrad-rennert.de/fachvokabular/KonradRennertsFachWortschatzGesprochenTeil1.xlsx

Die Fachsprache für den Beruf lernt man weniger aus den Lehrbüchern studierter Leute als aus dem Berufsalltag von Muttersprachlern. Wer hier zuwandert und sein Einkommen selbst verdienen möchte, braucht Unterstützung, damit Sprache um das ergänzt werden kann, was klassische Kurse zum Thema „Deutsch als Fremdsprache (DaF)“ nicht vermitteln. Dort wird zum Erlernen unserer Sprache hauptsächlich wichtiges Allgemeinwissen thematisiert. Die Fachlehrer sind auf ihr Studienfach „Deutsch“ spezialisiert und entsprechend sind die Kursmaterialien und die Gespräche im Unterricht ausgerichtet.

Der übliche DaF-Unterricht reicht aber nicht für die Ausbildungsberufe, z.B. Fachlagerist, Industriekauffrau, Mechatroniker, Bäcker, Altenpfleger oder Köchin und die weiteren 300 anerkannten Ausbildungsberufe, die es hierzulande noch gibt. Auch wer später ein MINT-Fach studieren will, bekommt in DaF-Kursen nur wenig vom notwendigen Fachvokabular beigebracht. Das sind nicht nur die persönlichen Erfahrungen eines IT-Trainers und Ausbilders mit vielen Auszubildenden, Studenten und Arbeitssuchenden, das spiegelt sich auch in Veröffentlichungen über die Sprachdefizite wider. Der Autor des Videos hat zwar auch einigen Menschen „aufs Maul geschaut“, aber als Absolvent eines MINT-Studienganges bevorzugt er nachvollziehbare Datenanalysen vorhandener Texte und Videoaufzeichnungen. Mit der verbreiteten Office-Software und den in Excel enthaltenen Pivot-Tabellen hat er ein passendes Werkzeug gefunden, Häufigkeitsverteilungen in Sachen des Wortschatzes aus allen frei zugänglichen Quellen zu extrahieren. Im Video beschreibt er die Vorgehensweise und stellt seine vollständigen Beispiele als Excel Arbeitsmappen bereit. Die Downloads und weitere Detail gibt es auf der Website des Autors: https://konrad-rennert.de/den-fachleuten-aufs-maul-schauen-wortschatzanalysen-mit-pivot-tabellen

Eigene Feststellungen als Auslöser des Projektes

Der Autor beobachtet seit Jahren die Prüfungsleistungen seiner Kursteilnehmer mit DaF-Hintergrund. Sie schneiden trotz vorliegender Sprachnachweise bei den schriftlichen Prüfungen zu IT-Kenntnissen wesentlich schlechter ab als deutsche Muttersprachler, weil sie das fehlende Fachvokabular nicht in einem mehrwöchigen Kurs aufholen können.

Die Hypothese ist: DaF-Kurse für Zuwanderer fördern Sprachkenntnisse im Kontext der Allgemeinbildung von Germanisten und sonstigen Sprachtrainern aber nicht mehr.

Den Fachjargon für fremde, nicht ausgeübte Berufe werden Deutschlehrer auch gar nicht gebrauchen, weil ihnen der Bezug und die Praxis fehlt. Diese plausible Behauptung ist (noch) nicht mit eindeutigen Fakten belegbar, weil sich weder der gesamte deutsche Wortschatz noch der Erfolg von DaF-Angeboten in amtlichen Statistiken wiederfindet. In Zukunft könnten jedoch den mehr oder weniger fundierten Abschätzungen des Sprachumfangs auch präzisere Angaben hinzugefügt werden. Genaue Analysen werden zukünftig auf künstlicher Intelligenz sowie Erkenntnissen aus Computerlinguistik und Korpuslinguistik basieren.

Der deutsche Wortschatz ist zu komplex, als dass man ihn bisher datenmäßig erfassen und ingenieurmäßig aufbereiten konnte. Nur für einzelne Individuen und deren Publikationen wurden bisher aussagekräftige Datenanalysen durchgeführt. Der bekannte Klassiker ist Goethe. Er hat in seinen Werken ca. 90.000 verschiedene Worte und Begriffe verwendet – das haben Forscher ausgezählt und darüber Analysen veröffentlicht. Die Zählung ginge mit den von Konrad Rennert vorgestellten Tools in wenigen Stunden, wenn die Werke als E-Book vorliegen. Für die Zusammenstellung von Fachvokabularen ist der aktive Wortschatz der aktiven Fachleute wichtig. Das heißt, wie setzen sie Sprache im Berufsalltag ein. Das ist ein Unterschied zu ihren schriftlichen Publikationen, welche schwerer zu verstehen sind.

Konrad Rennert hat begonnen, seinen eigenen aktiven Wortschatz zu analysieren und nutzt dazu die manuell aufbereiteten Untertitel seiner neuen YouTube-Videos. Sie sind veröffentlicht und allgemein verfügbar. Damit kann man das Vorgehen zunächst nachvollziehen und dann auf andere Video-Veröffentlichungen transferieren. Wenn Fachleute Videos produzieren und mit Untertiteln anreichern, können damit in kürzester Zeit zeitgemäße Fachvokabulare abgeleitet werden.

Der YouTuber Konrad Rennert (68) hat das mit den eigenen Erklärvideos durchgeführt und vollständig veröffentlicht. Das geschieht vor dem Hintergrund, dass er als Diplom-Physiker in den Geo-Wissenschaften ausgebildet wurde und seit Jahrzehnten die Analysewerkzeuge kennt und sein Know-how auf neue Fragestellungen transferieren kann. Nach erreichen der Altersgrenze arbeitet er weiter als IT-Trainer und forscht in Sachen Fachvokabular, um die eigenen Vermutungen mit Fakten zu belegen.

Seine Hypothese, dass DaF-Zertifizierungen in Sachen Fachsprache für Beruf und Studium kaum Aussagekraft haben, zeigt er an einem Fallbeispiel mit 17 eigenen Erklärvideos und deren deutscher Untertitelung. Mehr als 50% der WortUnikate aus seinen Aufzeichnungen sind nicht im Wortschatz des Goethe-B1 Sprachniveaus enthalten.

Dazu die Details: Das im Jahr 2022 aufgenommene Datenmaterial umfasst eine Abspieldauer von 5,2 Stunden. Die 17 vollständigen Transkripte enthalten 46.680 Worte. In der Zusammenfassung mit einer Pivot-Tabelle sieht man, dass er bei den Videos nur 3.829 verschiedene Worte eingesetzt hat. 1.671 Worte, d.h. 44% sind den Zuwanderern bekannt, die genau den B1-Wortschatz zu 100 % beherrschen und keine weiteren Vokabeln, die über die Wortliste zum Goethe-Zertifikat B1 der DaF-Deutschprüfung für Jugendliche und Erwachsene hinausgehen.

Das bedeutet, 2.158 Worte sind den Menschen mit DaF-Hintergrund unbekannt. Wenn 56% des beim freien Vortrag eingesetzten Wortschatzes unbekannt sind, ist das ein Problem beim Unterricht und in den Prüfungen. Auch Muttersprachler werden am Anfang von Kursen vielleicht 10% aller Fachbegriffe nicht kennen. Sie aber können diese überschaubare Zahl von Vokabeln in wenigen Tagen lernen.

Im Bewusstsein, dass das Fachvokabular in den schriftlichen Prüfungen beherrscht werden muss, stellt der Kursleiter bei Kursbeginn die Wortlisten für die Modulprüfungen bereit. Befragungen nach den Prüfungen am Kursende deuten an, dass sich Muttersprachler nur ein Zehntel bis zu einem Drittel der Wortliste erschließen mussten, während es bei den DaF-Teilnehmern wesentlich mehr war. Mit dem höheren Aufwand zum Erlernen der Fachbegriffe sinkt die Wahrscheinlichkeit, dem Unterricht folgen zu können und damit vermindern sich auch gute Prüfungsleistungen.

Das gesamte Fachvokabular ist jedoch um ein Vielfaches größer als das bei Prüfungen vorkommende Vokabular. Der Grundwortschatz zum Fach kann aus den als E-Books überreichten Kursmaterialien extrahiert werden. Wegen der hohen Performanz von Suchmaschinen und der Online-Lexika kann jede Vokabel mit relevanten Fundstellen im Internet verknüpft werden. Auch diese Wortlisten erhalten alle Interessenten zum Download.

Hilfreich für Zuwanderer ist auch das Wissen um Übersetzungs-Apps für die Kursunterlagen. DeepL ist derzeit am besten geeignet, wenn man schwer verständliche Texte in einer vertrauteren Sprache lesen möchte. Google-Translate kommt noch in Betracht, wenn gewünschte Sprachen noch nicht bei DeepL zu finden sind, z.B. Hindi, Arabisch oder Farsi

In den schon zuvor genannten 17 Erklärvideos hat Konrad Rennert jede automatische deutsche Transkription seiner gesprochenen Worte bei YouTube auf Richtigkeit überprüft. Die korrigierte Transkription hat er dann mit dem DeepL-Übersetzer in alle dort verfügbaren Sprachen übersetzt, zu denen jetzt auch Ukrainisch gehört.

Die Betrachter der Videos bewerten nicht nur die Übersetzungen in den Untertiteln als hilfreich, sondern auch die Option, dass die Abspielgeschwindigkeit an die eigene Aufnahmegeschwindigkeit angepasst werden kann. Kursteilnehmer berichteten, dass sie sich die Videos am besten mit 0,75 (75%) der normalen Geschwindigkeit ansehen, wenn viele Fachbegriffe vorkommen und man zum gesprochenen deutschen Text auch noch die Untertitel in einer anderen Sprache mitlesen möchte.

DeepL hat alle Untertitel fast fehlerfrei ins Englische übersetzt. Das neu hinzu gekommene Ukrainische verblüfft jedoch noch manchmal, so dass man an den fraglichen Stellen oft in eine andere Untertitelsprache wechselt, z.B. Englisch oder Russisch. Das Verständnis der Zusammenhänge in den Videos fällt in der Regel nicht schwer, wenn zu den verbalen Erklärungen ein Sachverhalt direkt am Beispiel auf dem Bildschirm gezeigt wird.

Der Online-Dozent möchte sein Wissen auch anderen Kursleitern frei verfügbar machen. Deshalb hat er die YouTube-Playlist https://www.youtube.com/watch?v=oHTy7iHYtog&list=PLhGYp2d1_OXtBZ6TQpjwHSkeErREZgym7 erstellt. Dort erklärt er nachvollziehbar alle Schritte, die er beim Kuratieren von Fachvokabularen mit der Textverarbeitung Word, der Tabellenkalkulation Excel und der notwendigen Automatisation mit Makros (VBA) vorgenommen hat. Eine Vorschau auf die Themen und die Optionen liefert die YouTube Präsentation https://www.youtube.com/watch?v=CZylVBe1MVw mit einer zugehörigen Excel-Arbeitsmappe zum Download. https://konrad-rennert.de/fachvokabular/KonradRennertsFachWortschatzGesprochenTeil1.xlsx

Um den Exkurs zu den Pivot-Tabellen als dem leistungsfähigen Tool zum Berechnen, Zusammenfassen und Analysieren nachvollziehen zu können, bedarf es guter Excel-Kenntnisse.

Alle Materialien sind mit einer CC-BY-Lizenz veröffentlicht und dürfen sowohl im Unterricht verwendet werden als auch mit eigenen Erweiterungen weitergegeben werden.

Wer sich am weiteren Ausbau von Wortlisten mit Fachvokabular beteiligt, kann kostenlos an den Workshops teilnehmen, nachdem die Zusammenarbeit in einer Videokonferenz besprochen wurde. Kontakt zoom@konrad-rennert.de