Sprachen und linguistische Vielfalt stehen im Mittelpunkt der Kultur, des Handels und der Zusammenarbeit Europas. Wir arbeiten, studieren, reisen, leben und machen Geschäfte über nationale und geografische Grenzen hinweg. Der digitale Binnenmarkt, eine Priorität der EU-Kommission für 2020, ist in seiner Substanz multilingual. Dennoch gibt es Stand heute keine ausreichende technologische Unterstützung für die einzelnen europäischen Sprachen, die die bestehenden Sprachbarrieren im täglichen öffentlichen Leben überwinden könnten. Im Gegenteil: Europas Sprachenvielfalt gestaltet sich oft als Hindernis, das den unbeschränkten Zugang zu öffentlichen Dienstleistungen, Geschäftsmöglichkeiten, Berufschancen und den freien Austausch von Informationen erschwert.
Insbesondere im gerade entstehenden digitalen Binnenmarkt (Digital Single Market, DSM) bilden sich durch Sprachbarrieren unsichtbare Grenzen: 99% aller europäischen Unternehmen sind kleine und mittelständische Unternehmen (KMU), von denen lediglich 7% grenz- und sprachübergreifend Geschäfte abwickeln. Ein ähnliches Bild zeichnet sich unter den europäischen Kunden ab, von denen es 90% bevorzugen, Webseiten in ihrer eigenen Sprache zu besuchen. Technologien, die eine direkte Kommunikation in allen europäischen Sprachen erlauben, haben somit einen signifikanten positiven Nutzen für Wirtschaft und Gesellschaft: Man geht davon aus, dass ein digitaler Binnenmarkt ein zusätzliches Wachstum von bis zu 340 Mrd. Euro, hunderttausende neue Jobs und eine kräftige wissensbasierte Gesellschaft schaffen kann.
Von neuen Möglichkeiten profitieren dank Sprachtechnologie
Zum diesjährigen Europäischen Tag der Sprachen am 26.09., hat die EU-Kommission einen entscheidenden Schritt in Richtung der Unterstützung eines tatsächlich multilingualen digitalen Binnenmarkts unternommen: Mit Hilfe der Connecting Europe Facility (CEF.AT) werden verschiedene Anwendungsbereiche im öffentlichen Dienst unterstützt, die künftig ohne Sprachbarrieren nutzbar sein sollen, insbesondere in den Bereichen Kundenrechte, Gesundheit, öffentliches Auftragswesen, Sozialversicherung und Kultur. Die Plattform beinhaltet auch europaweite Online-Dienstleistungen wie Europeana, das Open Data Portal oder die Online Dispute Resolution-Plattform.
Die Technologie hinter CEF.AT ist ein statistisches Verfahren der maschinellen Übersetzung namens MT@EC, das anhand bestehender Übersetzungen zu übersetzen lernt. MT@EC steht allen öffentlichen Verwaltungen, Dienstleistern und Regierungsstellen kostenfrei im Rahmen des CEF-Programms zur Verfügung. Aktuell wird das System vor allem für die Übersetzung von EU-Gesetzestexten sowie für die Übersetzung von Parlamentsdebatten verwendet. Um es auf die Bedürfnisse der öffentlichen Institutionen in Europa anpassen zu können, muss das System mit entsprechenden Beispieltexten für diese Anwendungsszenarien trainiert werden. Die Verfügbarkeit von entsprechenden Sprach- und Übersetzungsdaten (mono- und bilinguale Daten) aus dem Tagesgeschäft der europäischen nationalen Behörden sind somit Schlüssel zum Erfolg.
Mit der European Language Resource Coordination (ELRC), die vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) koordiniert wird in Zusammenarbeit mit namhaften europäischen Partnern wie der Evaluations and Language Resources Distribution Agency (ELDA), dem Institute for Language and Speech Processing (ILSP), Tilde sowie der Translation Automation User Society (TAUS), hat die Europäische Kommission nun die wohl umfangreichste Sammlung von Sprachdaten weltweit unternommen, die die Anpassung von CEF.AT auf die täglichen Bedürfnisse der öffentlichen Dienstleister in allen EU-Mitgliedsstaaten, Island und Norwegen ermöglichen soll und somit die Verfügbarkeit multilingualer Dienstleistungen für die Bürger, Behörden und Unternehmen in ganz Europa unterstützt. ELRC schließt somit nicht nur die bestehende Lücke in der Nutzung von MT@EC, indem es künftig auch für die Anforderungen in allen nationalen öffentlichen Institutionen funktionieren soll, sondern es stärkt auch die Existenz der Nationalsprachen Europas im Alltag.
Treffen Sie die ELRC live in Ihrem Land
Im Auftrag der EU-Kommission organisiert das ELRC Konsortium in allen 30 teilnehmenden Ländern lokale Workshops, im Rahmen derer nicht nur die Möglichkeiten von automatisierter Übersetzung, sondern auch die Wichtigkeit von Sprachdaten aufgezeigt werden. Vertreter aus allen nationalen Regierungsstellen, Behörden und sonstigen öffentlichen Dienstleistern sind herzlich eingeladen, in einem offenen Diskurs ihre Anforderungen an CEF.AT darzustellen und an der Anpassung der Plattform aktiv mitzuwirken. Gemeinsam mit Experten aus der EU-Kommission, mit Sprachdienstleistern und Sprachtechnologen sollen die Anforderungen des öffentlichen Dienstes erarbeitet werden, geeignete Quellen multilingualer Sprachdaten für MT@EC identifiziert werden und jegliche mit der Verwendung von Daten für maschinelle Übersetzungen zusammenhängende technische und rechtliche Fragestellungen geklärt werden. Alle Informationen rund um ELRC sowie Informationen zu den europaweiten ELRC Workshops und dem ELRC Helpdesk finden Sie online unter www.lr-coordination.eu. Der nächste Workshop in Deutschland findet am 29.09.2015 im Bundeshaus in Berlin (Bundesallee 216-218, 10719 Berlin) statt.
DFKI-Kontakt
Dr. Andrea Lösch, ELRC-Team
Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, DFKI
Campus D 3-2, D-66123 Saarbrücken
Tel. +49 681 857 75-5285
elrc-secreatriat(at)dfki.de