Gratis-Übersetzungstools im Internet – eine Supersache?

mit Keine Kommentare

Online-Marketing

Maschinelle Übersetzungen sor­gen im Vergleich zu früher für große Begeisterung bei Nutzern: Seit die neuro­nale Variante von Google Translate, DeepL (zu dem auch Linguee gehört) und anderen Anbietern auch in deren öffentlich und kostenlos zu­gäng­lichen Tools verwendet wird, klingen damit erstellte Über­set­zun­gen deut­lich flüssiger und idio­ma­tischer. Vor einigen Jahren wurde noch gerne über die teils sehr holprigen Ergeb­nisse ge­lacht – doch in­zwi­schen staunen selbst Sprach­profis über die Qualität maschineller Über­setzung.

ÜbersetzungenBild: Tessa Kavanagh auf Pixabay

Inhaltsverzeichnis: Gratis-Übersetzungstools

Neuronale ma­schi­nel­le Über­setzung

Die neuronale maschinelle Über­setzung (NMT) ist eine statistik­basierte Methode, bei der die „Maschine„ mit einem umfang­reichen Datenvolumen (der Ausgangs- und Zielsprache) trainiert wurde. Dies ist erst seit relativ kurzer Zeit möglich, da früher keine ausreichende Rechenleistung für Big Data zur Verfügung stand. Es gab zwar auch vorher (etwa seit Anfang des Jahrtausends) schon statis­tische maschinelle Übersetzung (SMT), die auf der Häufigkeits­ver­teilung von Phrasen in den Trainings­daten basierte. Diese Methode besteht – vereinfacht ausgedrückt – darin, auf der Basis der zwei­sprachigen Trainingsdaten den wahr­schein­lichsten Satz in der Zielsprache zu ermitteln. Die neu­ro­nale Methode unterscheidet sich davon insofern, dass sie basierend auf künstlicher Intelligenz und Deep Lear­ning die neuronale Vernetzung im Gehirn imitiert. Das bedeutet, dass die Zu­sammen­hänge zwischen Aus­gangs- und Zieltext von künst­lichen neuronalen Netzen er­fasst werden.

Professionelle Übersetzer wer­den immer häufiger gefragt, ob mensch­lich erstellte Über­setzungen (sog. Human­über­set­zungen) überhaupt noch benötigt werden. Gleichzeitig stellen wir uns als Sprach­dienstleister die Frage, ob wir maschinelle Übersetzung zu unserem eigenen Nutzen ein­setzen können. Im Praxistest überzeugt uns die maschinelle Übersetzung aller­dings längst nicht so sehr, wie man auf den ersten Blick erwarten könnte. Im Folgenden stellen wir die wich­tig­sten Heraus­forde­rungen bei der Nut­zung maschi­neller Übersetzungs­tools vor.

Qualitätsprobleme

Die Qualität ist bei Weitem nicht so verlässlich, wie man aufgrund der guten – und teilweise sogar hervorragenden – Lesbarkeit der Übersetzung durch neuronale Tools vermuten würde. Auch wenn die Grammatik korrekt ist, wer­den beispielsweise manch­mal Wörter oder ganze Satzteile ausgelassen, oder der Sinn wird verdreht. Das ist für Nutzer der maschinellen Über­setzung umso gefährlicher, je schlechter sie die Ausgangs­sprache beherrschen. Aber auch für Sprachexperten, die maschinenübersetzte Texte post-editieren (nachbearbeiten), ist das Risiko groß, Feh­ler zu übersehen.

Daraus folgt: Je wichtiger die 100%-ige Richtigkeit eines Textes (etwa ein Beipackzettel für Medi­kamente oder eine Bedienungsanleitung) ist, desto riskanter ist maschinelle Über­setzung (MT), egal wie standardisiert die Formulier­ungen auch sein mögen. Dazu kommt, dass die Maschine Fehler im Ausgangstext nicht erkennt, egal wie unlogisch der Text dadurch wird. Die Maschine hat im Gegensatz zu einem mensch­lichen Übersetzer schlicht­weg „keine Ah­nung“, was sie da eigentlich über­setzt.

Wenn dann so etwas heraus­kommt wie „Die italienische Sängerin Andrea Bocelli schaffte es diese Woche auf Platz eins der Albumcharts“ oder „Die letzten 24 Stunden haben bestätigt, dass Theresa Mays Brexit Deal tot im Wasser ist“, mag das noch lustig sein. Wenn aber in einem Vertrag oder einer Vollmacht ein Halbsatz fehlt, kann das schwer­wiegende juris­tische Folgen haben.

Datenschutz-Risiko

Bei den kostenlos im Internet ver­fügbaren Übersetzungstools wer­den alle eingespeisten Daten von den jeweiligen Anbietern auf deren Servern gespeichert und weiterverwendet. Somit dürfen in diesen Tools gemäß Daten­schutz-Grundverord­nung (DSGVO) nie­mals vertrauliche bzw. personenbezogene Daten Dritter eingegeben werden, da dies als Datenverarbeitung gemäß Art. 4 DSGVO gilt. Das bedeutet zwangs­läufig, dass man Texte in einer völlig frem­den Sprache nicht einfach online maschinell über­setzen lassen darf, da man ja gar nicht weiß, ob der Text personen­bezogene Daten enthält.

Dasselbe gilt für alle Texte, die mit Urheberrechtsschutz belegt sind. Gebe ich einen solchen Text ohne Zustimmung des Autors in Google Translate o. ä. ein, stelle ich den Text Dritten zur Verfü­gung und verletze somit das Urheber­recht. Die Tatsache, dass Google Translate „das Internet auf Texte durchsucht und sie einsammelt, um sie in einen riesigen Topf für statistisch basierte MT (dazu zählt auch die NMT) zu verwenden, verstößt gegen das Urheberrecht, denn sicherlich ist bei der Un­menge an Tex­ten aus dem Internet nicht systematisch um eine Nutzungserlaubnis gebeten worden“. 1)

1) Abraham de Wolf: Übersetzen mit Software, wer ist der Urheber? In: Jörg Porsiel (Hrsg.): Maschinelle Übersetzung, BDÜ Fachverlag, S. 61 f

DeepL hat in seine Daten­schutz­erklä­rung zumindest einen ex­pliziten Hinweis eingefügt: „Bitte beachten Sie, dass Sie unseren Übersetzungsservice nicht für Texte mit personenbezogenen Daten jeglicher Art nutzen dür­fen.“ Bei Google Translate oder im Bing Microsoft Translator fehlt ein solcher Hinweis und es wird auch nicht darüber infor­miert, was mit den eingegebenen Texten bzw. den Übersetzungen geschieht. Es kann lediglich der allgemeine Servicevertrag aufgerufen werden, der für die Nutzung von Diensten des Anbieters gilt. Im Microsoft-Ser­vice­vertrag heißt es beispielsweise unter „Ihre Inhalte“: „Wenn Sie Ihre Inhalte mit anderen Personen teilen, stimmen Sie ausdrücklich zu, dass diese Personen berechtigt sind, Ihre Inhalte kostenlos und weltweit zu nutzen, zu speichern, aufzuzeichnen, zu vervielfältigen, zu versenden, zu übertragen, zu teilen, anzuzeigen und weiterzu­ge­ben. Wenn Sie anderen Personen diese Möglichkeit nicht einräumen möchten, geben Sie Ihre Inhalte nicht über die Dienste frei.

Arbeitsaufwand

Maschinelle Übersetzungen kön­nen durch eine Nach­bear­beitung (sog. Postediting) durch menschliche Übersetzer verbessert werden. Je nach Anspruch an die Qualität des Zieltextes unterscheidet man zwischen leichtem (light) und vollständigem (full) Postediting. Bei der leichten Variante werden zum Bei­spiel nur Sinn­fehler sowie Gramma­tik und Recht­schreibung korrigiert, nicht aber der Stil oder seltsame Satzstellungen. Selbst diese Variante kann je nach Output der Maschine relativ aufwändig sein. Das vollständige Postediting, dessen Ergebnis sich dem einer von menschlichen Profis erstellen Über­setzung zumindest stark annähern sollte, ist noch wesentlich zeit- und kosten­intensiver. Welche Fehler­arten genau zu korrigieren sind, muss im Vorfeld mit dem Kunden bzw. Nutzer der Übersetzung abgestimmt werden, denn insbesondere der Stil, aber auch die Verwendung eines bestimmten Fachvokabulars sind nicht für alle Textsorten (und Leser) gleich wichtig. Damit kann vollständiges Postediting aufwendiger und im Endeffekt teurer sein als eine (neue) Übersetzung durch einen qualifizierten Sprach­dienstleister.

Es ist auch zu beachten, dass Postediting nicht als Revision (d. h. Korrekturlesen) durch einen zweiten Übersetzer gilt, wie es beim Vier-Augen-Prinzip nach der Norm ISO 17100 „Übersetzungs­dienstleistungen und Qualitäts­management in Übersetzungs­unternehmen“ vorgesehen ist. Die Revision folgt ggf. nach Abschluss des Post­editing. Der Aufwand für die Nachbearbeitung einer maschinellen Übersetzung kann erheblich sein und ist schwer vorauszusehen, da die Qualität von MT stark variiert. Sie hängt vom Fachgebiet ab und natürlich auch davon, wie umfangreich und mit welcher Datenqualität eine Maschine für das spezielle Thema und die benötigte Sprach­kombination trainiert wurde. Die Sprachkombination hat ohnehin eine starke Auswirkung auf die Qualität einer maschinell angefertigten Übersetzung, da für seltener Sprachpaare nicht genügend Daten zur Verfügung stehen, um Maschinen umfassend zu trainieren.

Benötigte Expertise

Die Postediting-Norm DIN ISO 18587 verlangt, dass Posteditoren über einen Hochschulabschluss im Bereich Übersetzung bzw. „mit einen wesentlichen Anteil an Über­setzungsausbildung“ oder über einen anderen Hoch­schulabschluss und ent­sprechende Berufserfahrung verfügen müssen. Ohne Hochschulabschluss muss laut der ISO-Norm die „Berufs­erfahrung auf dem Gebiet des Übersetzens oder Posteditierens einer Zeitdauer von fünf Jahren Vollzeit entsprechen“. Weitere vorgesehene Kriterien sind u. a. technische, kulturelle und Sachgebiets­kompetenz sowie auch die Kompetenz bei Recherche, Informa­tions­gewinnung und -verarbeitung. Außerdem müssen Posteditoren allgemeines Wissen über MT-Technologien und darüber, welche Arten von Fehlern bei MT-Systemen auftreten, besitzen.

Eine effektive Nachbearbeitung von maschinenübersetzten Texten sollte also keinesfalls von Laien durch­geführt werden, und auch umfangreiches Fachwissen auf dem Sachgebiet eines Textes genügt nicht, um eine inhaltlich richtige und/oder qualitativ hoch­wer­tige Endfassung zu gewährleisten. Auch beim Einsatz von MT geht also nichts ohne hochausgebildete Über­setzungs­experten.

Fazit

Kostenlose Übersetzungs­tools bergen viele Risiken und können von profes­sionellen Über­setzungs­dienstleistern schon aufgrund des Daten­schutzes, aber auch aus Qualitäts­gründen nur sehr einge­schränkt genutzt werden. Sicherlich gibt es Texte und Situationen, in denen diese Tools für Privat­personen hilfreich sind. Dazu zählen öffentlich zugängliche Texte wie beispielsweise Presse­meldun­gen oder Artikel im Internet, die jemand grundsätzlich verstehen möchte und bei denen nicht jedes Detail absolut richtig übersetzt sein muss. Oder Texte, die ansonsten gar nicht übersetzt würden, wie etwa touris­tische Informa­tionen.

Nicht unerwähnt bleiben sollten lizenzpflichtige Lösungen für maschinelle Übersetzungen, die auf bestimmte Fach­gebiete und Textsorten trainiert werden können. Diese sind vor allem bei großen Technikfirmen wie beispiels­weise Siemens oder VW, aber auch bei den EU-Institutionen im Einsatz. Je standardisierter die Sprache im Ausgangs­text ist, desto höher kann auch die Qualität sein – wenn die Maschine in riesigem Umfang mit korrekten und fachlich passenden Trainingsdaten gefüttert wurde. Solche Systeme sind jedoch für ein fachlich breit aufge­stelltes Über­setzungs­büro mit deutlichem Schwerpunkt auf „frei“ zu übersetzenden Marketing- und Werbetexten wie die Peschel Communications GmbH derzeit nicht sinnvoll. Bei fachlich hoch anspruchsvollen und auf den einzelnen Kunden maßge­schneiderten Über­setzungen ist der menschliche Übersetzer der Kombination Maschinen­überset­zung/Postedi­ting in Bezug auf Zeitaufwand und Ergebnis deutlich überlegen. Wir verfolgen die Entwicklung der diversen Tools jedoch sehr aufmerksam und wollen uns dem technischen Fort­schritt in diesem Bereich auf keinen Fall verschließen.

„Haben Sie von diesem Beitrag profitiert? Dann verlinken Sie bitte kundennutzen.ch, weil Sie dabei helfen, dass auch andere Personen davon profitieren kön­nen.“

Ellen GöpplAutorin:
Ellen Göppl stell­ver­tre­ten­de Leiterin Über­set­ze­rin, Revi­sorin, Lekto­rin, Projektmanagerin Dol­met­schen bei der Peschel Communi­ca­tions in Freiburg.