Eine neue Studie der Johannes Gutenberg-Universität Mainz (JGU) zeigt, dass große Sprachmodelle klare Vorurteile gegenüber Menschen haben, die deutsche Dialekte sprechen. Untersucht wurden sieben Dialekte – darunter auch ripuarische Varianten, wie sie im Raum Köln, Aachen und Mönchengladbach verbreitet sind. Das Ergebnis: KI-Systeme ordnen Dialektsprechern häufiger negative Eigenschaften zu als Sprecherinnen und Sprechern des Standarddeutschen. Besonders stark fällt der Unterschied beim Merkmal „ungebildet“ aus – fast alle getesteten Modelle setzen Dialekt automatisch mit niedriger Bildung gleich. Selbst positive Zuschreibungen aus der klassischen Dialektforschung wie „freundlich“ kehren manche Modelle ins Gegenteil um.
Die Forschenden testeten zwei Szenarien. Zum einen gaben sie den Systemen ausdrücklich vor, dass eine Person im Dialekt schreibt. Zum anderen ließen sie nur Dialekttexte für sich sprechen, ohne den Begriff „Dialekt“ zu erwähnen. In beiden Varianten entstanden deutliche Verzerrungen. Am stärksten aber reagierten die Systeme, wenn der Dialekt offen benannt wurde. In Entscheidungstests wiesen KIs Dialektsprechern häufiger Jobs mit geringeren Qualifikationsanforderungen zu – etwa Hilfstätigkeiten in der Landwirtschaft statt akademischer Berufe. In Zuordnungsaufgaben bekamen Dialekttexte Begriffe wie „unorganisiert“, „unkultiviert“ oder „rural“ zugeteilt.
Die Studie deutet darauf hin, dass größere Modelle stärkere Verzerrungen zeigen als kleinere. Dialekte werden von der KI nicht etwa als Tippfehler oder „kaputter Text“ interpretiert, sondern als Signal für bestimmte soziale Eigenschaften. Unterschiede zwischen einzelnen Dialekten gab es zwar, aber alle zeigten denselben Trend: negative Bewertung.
Für Regionen wie Mönchengladbach, wo viele Menschen zwischen Hochdeutsch und lokalen Sprachfärbungen wechseln, wirft das Fragen auf. Sprachmodelle können im Alltag Rollen spielen – etwa bei Bewerbungen, beim Kundenservice oder in der Verwaltung. Wenn KI-Systeme Dialekt automatisch mit geringer Kompetenz verknüpfen, könnten daraus Nachteile entstehen, die Betroffene nicht einmal bemerken.
Quelle: https://nala-cub.github.io/ – Arbeitsgruppe „Natural Language Processing” (NALA) von Prof. Dr. Katharina Wense

Das könnte Dich auch interessieren:
Repair Café bei mags
Einbrüche in Giesenkirchen
Weihnachtszauber in Rheydt lockt mit neuem Highlight