Der VokalJäger: Meine Dissertation als freier Download

Für meine Promotion in Germanistik am Deutschen Sprachatlas in Marburg 2016 stellte ich mir die Frage, ob man denn (Frankfurter) Dialektalität in einem Sprachsignal, also in einer Tonaufnahme, phonetisch messen kann. Dazu entwickelte ich einen Machine-Learning-Algorithmus und schickte ihn auf die „Jagd” nach Frankfurter Vokalen: den VokalJäger.

Meine Dissertation ist frei unter einer CC-BY Lizenz verfügbar und kann hier als PDF heruntergeladen werden. Online darin blättern kann man auf archive.org.

Der Text der Buchs ist wie folgt strukturiert: Tabelle 1 auf S. 3 liefert eine Übersicht über die vorliegende Arbeit und eine Zuordnung der Teile und Kapitel zu den Fachbereichen. Die Arbeit ist grob in drei Teile und die Anhänge geteilt. Im Einzelnen besteht die Arbeit in den drei Hauptteilen aus den acht Kapiteln mit den Nummern 2 bis 9, die im Folgenden kurz zusammengefasst werden. Dazu kommen Einleitung sowie Schluss und Ausblick (Kapitel 10 ab S. 427).

Teil I der Arbeit, Messphonetik, S. 15f., enthält eine Einführung (Kapitel 2), den theoretischen Hintergrund und die Beschreibung der messphonetischen Algorithmik des VokalJägers (Kapitel 3) als auch Ergebnisse für das Hochdeutsche (Kapitel 4). Diese Kapitel richten sich an den messphonetisch und algorithmisch interessierten Leser.

Teil II, Klassifikationsphonetik, S. 169f, beschreibt die Machine-Learning Algorithmik des VokalJägers (Kapitel 5) und die klassifikationsphonetische Kalibrierung auf das Hochdeutsche (Kapitel 6). Die Zielgruppe sind Leser, die an Klassifikationsphonetik mittels Machine-Learning interessiert sind.

Teil III, Frankfurterisch, S. 233f., beschreibt den Frankfurter Stadtdialekt allgemein und führt in die genutzten Quellen ein (Kapitel 7), insbesondere in die für das Frankfurterische untersuchten Tondokumente (Kapitel 8). Der Teil schließt mit einer Diskussion der wichtigsten Sprachwandelphänomene des Frankfurter Vokalismus unter expliziter Nutzung des VokalJägers (Kapitel 9). Dieser Teil richtet sich an den am Frankfurterischen interessierten Leser.

aus: [Keil, 2017, Kapitel 1.2]


Die Dissertation erschien ursprünglich 2017 als Band 122 in der Reihe Deutsche Dialektgeographie, Band 122 (Hardcover gebunden, Format A4, XVI/513 S., mit zahlreichen Abb., Grafiken und Tabellen. ISBN: 978-3-487-15588-3. Georg Olms Verlag, Hildesheim).

Die Schwesterwebseite VokalJaeger.org beschreibt die Algorithmik technisch. Dort sind auch Code und Daten verfügbar.

Der VokalJäger: Zusammenfassung

Der VokalJäger ist eine algorithmische Prozesskette zur automatisierten Klassifikation phonetischer Merkmale in monophthongischen Vokalen. Algorithmische Methoden aus der robusten Messphonetik und der mathematischen Klassifikationsalgorithmik bzw. dem Machine-Learning kommen zum Einsatz. Der VokalJäger wird auf eine hochdeutsche Referenz von zehntausend Vokalproben trainiert. Dann schätzt er automatisiert und ohne menschliche Intervention die statistische Verteilung des sogenannten gleitenden phonetischen Merkmals in Tonaufnahmen. So können phonetisch-phonologische Hypothesen quantitativ getestet werden, insbesondere ob Laute qualitativ zusammenfallen (Merger) oder getrennt bleiben. Damit ist der VokalJäger ein statistisches Werkzeug der historischen Dialektphonologie.

Im phonologischen Teil der Arbeit werden die vokalischen Kernphänomene des einstigen Frankfurter Stadtdialekts dargestellt - mit Schwerpunkt auf den A-Lauten. Die Untersuchung basiert zum einen auf bisher ungedruckten Quellen aus dem Frankfurter Institut für Stadtgeschichte. Dabei handelt es sich um die handschriftlichen Lautbelege Joseph Oppels und Ludwig Rauhs aus dem Fundus des Frankfurter Wörterbuchs. Zum anderen werden schwerpunktmäßig ausgewählte historische Tondokumente des Frankfurterischen mit dem VokalJäger untersucht, insbesondere die Frankfurter Aufnahme aus dem Lautdenkmal reichsdeutscher Mundarten von 1937 und neuere Aufnahmen aus dem Projekt Regionalsprache.de (REDE). Mit diesen einmaligen Daten ist es zum ersten Mal möglich, den Sprachwandel des Frankfurter Stadtdialekts über zweihundert Jahre in Real-Time phonetisch-phonologisch zu untersuchen.

Es zeigt sich, dass gerade Merger-Phänomene wesentlich sind: Einerseits fiel das altlange â klanglich mit dem Dehnungs-Aː in einem dunklen A zusammen - ganz unterschiedlich zum Zentralhessisch der Umgebung, das zwei getrennte Laute bewahrte. Andererseits ist das dunkle A im Neu-Frankfurterischen nicht mehr nachweisbar - es ist mit dem neutralen A verschmolzen. Abschließend zeigt sich ein Split bei den Vorderzungenvokalen, die nun als runde und ungerundete Laute die dialekttypische Entrundung auslösen.

[Keil, 2017, S. 1]

Einführung und Hintergrund

Der Ausgangspunkt dieser Abhandlung war 2004 eine Untersuchung der Vokale des ehemaligen Frankfurter Stadtdialekts - ursprünglich rein aus Sicht der historischen Dialektphonologie unter Nutzung neuer Schriftquellen. 2013 entstand daraus ein Dissertationsprojekt am Deutschen Sprachatlas in Marburg. Zum Frankfurter Stadtdialekt, ebenso wie für andere Dialekte des Deutschen, existieren jedoch überdies historische Tondokumente, die bisher kaum ausgewertet wurden, wie z. B. die Frankfurter Aufnahme aus dem Lautdenkmal reichsdeutscher Mundarten von 1937. Auch im Projekt Regionalsprache.de (REDE) entstanden zahlreiche Frankfurt zugeordnete Sprachaufnahmen.

So lag es nahe, den Frankfurter Vokalwandel ebenfalls anhand dieser Tondokumente zu untersuchen. Dazu war es nötig, ein Werkzeug zu schaffen: den VokalJäger. Der VokalJäger ist eine allgemein nutzbare algorithmische Prozesskette zur automatisierten Merkmalsklassifikation und bildet seit 2014 den Schwerpunkt dieser Arbeit. Die Klassifikation erfolgt implizit und quantitativ: Es werden mess- und klassifikationsphonetische statistische Modelle genutzt, die auf einem hochdeutschen Referenzdatensatz von zehntausend Vokalproben aus dem Kiel-Korpus „trainiert” wurden. So wird der Frankfurter Vokalismus mit Werkzeugen dreier Fachbereiche transdisziplinär angegangen: der robusten Messphonetik, der algorithmischen Klassifikation bzw. dem Machine-Learning und der historischen Dialektphonologie bzw. der Germanistik.

Mit diesem Ansatz kommt eine Herausforderung für die hier vorliegende Darstellung: Das Werkzeug - als algorithmische und statistische Software - ist prinzipiell erst einmal der klassischen Germanistik wesensfremd. Und das Werkzeug ist neu. Folglich ist ein großer Teil der Arbeit den technischen Konzepten der algorithmischen Messphonetik (Statistik akustischer Größen) und Klassifikationsphonetik (Machine-Learning) gewidmet. Auch muss erst anhand von Testdaten und Experimenten umfänglich gezeigt werden, dass dieser Apparat auch „funktioniert”, bevor er mit Dialektproben zum gewünschten Nutzeinsatz kommen kann.

[Keil, 2017, Kapitel 1.1]

Besprechungen und Zitationen

Em. Univ. Prof. Dr. Peter Wiesinger, Wien auf der Webseite des Olms-Weidmann Fachverlags:

Carsten Keil gelingt es durch die Verbindung von mathematisch-naturwissenschaftlichen und linguistisch-geisteswissenschaftlichen Möglichkeiten, Lautwandlungen im Frankfurter Stadtdialekt im Lauf der letzten 200 Jahre exakt aufzuzeigen. Von den umgebenden zentralhessischen Dialektverhältnissen stark abweichend, hat der Stadtdialekt eigene Wege beschritten, wozu insbesondere der Wandel des gedehnten a gehört. Mit dem VokalJäger, einer allgemein nutzbaren algorithmischen Prozesskette zur automatischen Merkmalsklassifikation, werden in Verbindung mit robuster Messphonetik und historischer Phonologie die Lautqualitäten exakt ermittelt und die daraus resultierenden Lautwandlungen in den sich verändernden Lautsystemen aufgezeigt. Auf diese Weise liefert der Autor durch Methodenkombination eine neue Ergebnisse bringende, aufschlussreiche Studie.

Pia Bergmann, in: Osnabrücker Beiträge zur Sprachtheorie 95 (2019), S. 267-271:

Es wird (…) deutlich, dass die Arbeit auch über die eigentliche Leistung der Entwicklung und exemplarischen Anwendung des Vokaljägers hinaus eine beeindruckende Fülle an Material versammelt, die alleine schon die Lektüre lohnt (…) Alles in allem liegt mit dem Buch eine Publikation vor, die - wie der Titel ja auch verrät - ihren deutlichen Schwerpunkt in den technischen und methodischen Aspekten des VokalJägers hat (…) Es sei dem Buch (…) und seiner zukünftigen Anwendung willen eine vielfache und gründliche Lektüre gewünscht.

Koloman Brenner, in: Zeitschrift für Deutsche Linguistik (ZDL), 2019/3, S. 357-359:

Die phonologische Systematik liefert in diesem Zusammenhang besonders wertvolle Einblicke in die Entwicklung der Stadtsprache von Frankfurt. Wie die Ergebnisse der Studie zeigen, die im dritten Teil detailliert geschildert werden, kann anhand der untersuchten historischen Dokumente von 1825 bis 1945 eine langsame Entwicklung der Frankfurter Stadtsprache nachgewiesen, danach aber eine rapide Veränderung festgestellt werden. (...). Zusammenfassend reiht sich das Werk von Keil gut in eine doch immer größere Reihe von messphonetisch fundierten Arbeiten zu deutschen Dialekten ein.

Herrgen, Joachim und Lars Vorberger, in: Rheinfränkisch, erschienen in: Deutsch, Sprache und Raum, 2019, S. 504:

Eine aktuelle sprachdynamische Studie ist Keil (2017), der den Lautwandel in Frankfurt (Übergangsgebiet Zentralhessisch, Rheinfränkisch) untersucht. Hier liegt nun eine echt sprachdynamische Studie vor, indem verschiedene Zeitabschnitte vergleichbar gemacht und mit modernsten Methoden analysiert werden. Keil (2017) klassifiziert Laute dialektintendierter Sprachdaten mit einer phonetisch-algorithmischen Methode und kann empirisch nachweisen, dass die A-Verdumpfung in Frankfurt abgebaut wird.

Ergebnisse und Schlussbetrachtung

Diese Arbeit spannt den Bogen von algorithmischer Messphonetik über Klassikationsphonetik mittels Machine-Learning bis hin zur Dialektphonologie. Mit dem VokalJäger wurde ein leistungsfähiges, statistisches Werkzeug konzipiert und geschaffen, das zeigt, wie produktiv solch ein transdisziplinärer Ansatz sein kann.

Im Bereich der Messphonetik wurden für den VokalJäger Algorithmen entwickelt, die - im Augenblick noch mit Einschränkung hinsichtlich der Segmentierung - eine fast vollständig automatisierte Berechnung akustischer Größen aus Tonaufnahmen ermöglicht, ohne, dass dabei menschlich-subjektive Intervention nötig wäre. Dazu gehört insbesondere die Korpus-unabhängige Berechnung und Sprecher-Normalisierung von Formantbahnen, die robust gegenüber Messfehlern, Ausreißern und speziell Unterschieden in den Lauthäufigkeiten ist. Im Ergebnis lassen sich so z.B. im Kiel-Korpus Formanten messen, die den üblichen, erwarteten Werten und Mustern für das Hochdeutsche entsprechen (vgl. Teil I der Arbeit und vornehmlich Abbildung 56 auf S. 151).

Zur Identifikation und Messung von Lautunterschieden auf einer kontinuierlichen, gegen das Hochdeutsche geeichten Skala, wurde das Konzept des gleitenden phonetischen Merkmals eingeführt. Der daraus abgeleitete Merkmalswert ζ gleitet zwischen den klassisch-ordinalen Elementarausprägungen wie z.B. offen, halboffen, halbgeschlossen und geschlossen und kann dabei Zwischenwerte annehmen, die sonst üblicherweise mit Diakritika bezeichnet werden. Es kann nun getestet werden, ob sich die Merkmalswerte zwischen zwei Kontrastgruppen statistisch signifikant unterscheiden, wie etwa zwischen den kurzen A und den Dehnungs-A. Mit der so errechneten Merkmalsdifferenz ∆ζ kann z.B. bestimmt werden, ob bzw. wie stark in einem solchen Kontrastpaar ein Merger hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvokale vorliegt.

Mathematisch-technisch ist der beschriebene Ansatz im VokalJäger mittels Machine-Learning-Algorithmik implementiert. Dabei wird der VokalJäger auf die Merkmale des Hochdeutschen, repräsentiert durch zehntausend Vokalproben aus dem Kiel-Korpus, trainiert. Es zeigt sich, dass mit dem mathematischen Schätzermodell der Mixture-Discriminant-Analysis und den ersten drei Formanten als messphonetische Prädiktorvariablen gleitende Merkmalswerte errechnet werden können, die den erwarteten Mustern des Hochdeutschen entsprechen (vgl. Teil II der Arbeit und insbesondere Abbildung 85 auf S. 228).

Es ist ein besonderer Glücksfall, dass für den Frankfurter Stadtdialekt zwei unabhängige Bestandsaufnahmen existieren, die etwa siebzig Jahre auseinanderliegen. Da ist zum einen Joseph Oppel, der von 1839 bis 1894 handschriftlich Aufzeichnungen zur Mundart anfertigte, die vor allem hinsichtlich der Vokalqualität und -quantität explizit und hoch präzise sind (Oppel 1839-1894). Zum anderen ist da Ludwig Rauh, der 1921 mit seiner handschriftlichen Dissertation zum Frankfurterischen promovierte und bis zu seinem Tod 1945 die Grundlagen für das erst 1988 fertiggestellte Frankfurter Wörterbuch schuf (Rauh [1921a] und Rauh/Bodensohn [1939-1945]). Oppels und Rauhs Schriftbelege aus dem Frankfurter Institut für Stadtgeschichte, die so nicht im Frankfurter Wörterbuch veröffentlicht wurden, sind hier zum ersten Mal mit phonetisch-phonologischer Präzision kontrastiv gegenübergestellt und ausgewertet worden.

Durch die einzigartigen Belege Oppels und Rauhs lässt sich der Lautwandel des Frankfurterischen von etwa 1825 bis 1945 in Real-Time darstellen. Mit dem VokalJäger ist es darüber hinaus möglich, die Schriftbelege durch klassiffkationsphonetische Untersuchungen zu ergänzen, die ebenfalls Real-Time-Einblicke geben. Zum Frankfurterischen existiert mit dem Frankfurter Lautdenkmal von 1937 eine Tonaufnahme aus der Spätphase des Stadtdialekts - diese kann kontrastiv um weitere Tondokumente aus neuerer Zeit ergänzt werden, insbesondere aus dem Projekt Regionalsprache.de (REDE).

Es zeigt sich ein moderater Wandel des Frankfurterischen von etwa 1825 bis 1945 und dann eine rapide Wandlung bis heute. Definiert man Frankfurterisch als die rheinfränkische Mundart, die unterschiedlich zur Umgebung ist und nur in Frankfurt gesprochen wird, starb dieser Stadtdialekt als eine distinktive Einheit nach 1945 aus. Für das Frankfurterische wesentlich sind gerade Merger-Prozesse. So fielen etwa das altlange â und das Dehnungs-A in einem dunklen [O:]-ähnlichen Laut zusammen, der in dieser Arbeit als dunkles A, [A:], bezeichnet wird - anders als z.B. im Zentralhessischen der Vororte, wo â ein geschlossenes [o:] war. Dieses dunkle A, das Wahrzeichen des Stadtdialekts, das sowohl lang als auch kurz vorkam, verschwand im Lauf der Zeit. Mit dem VokalJäger kann man es im Frankfurter Lautdenkmal von 1937 noch sehr gut messen - im Neu-Frankfurterischen ist nur noch der Merger mit dem neutralen [a] festzustellen. Bei den Vorderzungenvokalen ist es umgekehrt. Hinsichtlich des gleitenden Merkmals der Rundung der Vorderzungenvokale zeichnete sich das Frankfurterische durch einen Zusammenfall (hochdeutsch) runder und ungerundeter Vokale in einem entrundeten Zustand aus. Diese Entrundung ist mit dem VokalJäger noch durchgehend im Frankfurter Lautdenkmal, aber auch im Neu-Frankfurterischen messbar - allerdings mit deutlich abnehmender Durchdringung: der Frankfurter Merger-Zustand bezüglich Rundung wird aufgelöst (vgl. Teil III und speziell die Abbildungen 116 auf S. 405 und 117 auf S. 407).

Abschließend lässt sich feststellen, dass mit dem VokalJäger ein neues Werkzeug in die historische Dialektphonologie eingebracht werden konnte. Der VokalJäger sowie die Schriftbelege Oppels und Rauhs ermöglichten zum ersten Mal, eine phonetisch-phonologische Lautwandeluntersuchung des Frankfurter Stadtdialekts durchzuführen - und zwar in Real-Time über fast zweihundert Jahre.

[Keil, 2017, Kapitel 10.1]