Im Dienste der Maschine: »DeepL & Co.« und ihre beeindruckenden Ergebnisse

von Peter Winslow, veröffentlicht am 23.07.2019

In einem Host paper der European Union Institutions vom 29. April 2019 mit dem Titel »New Technologies and Artificial Intelligence in the field of language and conference services« lesen wir:

While LTs [language technologies] and the relevant AI are very sophisticated and useful, they are not yet mature. However, AI has recently become a buzzword that is often depicted in mainstream media as a technology that is already able to solve all problems in the field and match human quality (Seite 10, Randnummer 15).

Zum Beispiel wird für DeepL seit langem Werbung gemacht: »Das Sprachprogramm DeepL legt binnen Sekunden fast fehlerfreie Übersetzungen vor«, schreibt bspw. Herr Prof. Dirk Siepmann in der FAZ im Oktober 2018 unter dem Rubrum Fremdsprachendidaktik. Solche starken Aussagen sind jedoch nicht nur in der Tagespresse, sondern auch in der Übersetzungspresse zu finden. Der Unterschied zwischen den beiden besteht lediglich darin, dass die Stimmen der Tagespresse zumindest den Anschein fachlicher Betrachtung aufrechterhalten wollen, während die Stimmen der Übersetzungspresse mit einem widersprüchlichen Optimismus behaftet sein kann, mit dem die Leserschaft zur Kasse gebeten wird.

A case in point. Am 11. April 2019 brachte Üpo, ein Nachrichtenportal und Online-Magazin für Übersetzer und Dolmetscher, einen Werbeartikel mit dem Titel »Software zur Autorenunterstützung – So optimieren Sie die Qualität maschineller Übersetzungen« heraus. Der Autor, Herr Stefan Kreckwitz, behauptet, »DeepL & Co. liefern mittlerweile sehr beeindruckende Ergebnisse«, und sieht Software zur Autorenunterstützung und die maschinelle Übersetzung als sich ergänzende Mittel zur Erstellung »sprachlich korrekte[r], eindeutig interpretierbare[r] Texte«. Die von DeepL & Co. gelieferten Ergebnisse sind so beeindruckend, dass sie nur durch den Kauf seiner Software zur Autorenunterstützung erzielt werden können. Mit anderen Worten: Diese Ergebnisse sind so beeindruckend, dass sie ohne Weiteres nicht beeindruckend sind.

Um in den Genuss der sehr beeindruckenden Ergebnisse zu kommen, soll man nicht nur den Duden einhalten (Rechtschreibung etc.), sondern auch »[s]prachliche Unkorrektheiten, Mehrdeutigkeiten oder komplexe Satzkonstruktionen« und »[u]nterschiedlich interpretierbare Sätze oder sogar Wörter« vermeiden. Neben solchen sprachlichen Tücken stellen auch »[l]ange Sätze mit vielen Verschachtelungen [] eine weitere Herausforderung für maschinelle Übersetzungs-Systeme« dar. But fear not. »Software zur Autorenunterstützung«, schreibt er weiter, »kann helfen«. Diese Software soll eine »regelbasierte Sprachprüfung« durchführen, die »sprachlich korrekte, eindeutig interpretierbare Texte mit kurzen Sätzen« gewährleistet, »die wiederum eine gute Basis für maschinelle Übersetzungen liefern«. Hierzu seien unter anderem elf Regeln erforderlich – ich zitiere:

  1. Ganze Sätze in Klammern vermeiden
  2. Zu lange Komposita aufgliedern
  3. Schrägstriche vermeiden
  4. Bedingungssatz mit »wenn« einleiten
  5. Konstruktionen ohne Verb vermeiden
  6. Artikellose Nominalphrasen vermeiden
  7. Auslassungen bei zusammengesetzten Wörtern vermeiden
  8. Zu viele Bedeutungseinheiten vermeiden
  9. Satzlänge verkürzen
  10. Verschachtelte »zu«-Konstruktionen vermeiden
  11. Passiv vermeiden

Die Werbung von Herrn Kreckwitz liest sich wie Realsatire. »Wir waren kompliziert genug, die Maschine zu bauen«, scheint er mit Karl Kraus zu sagen, aber er folgt Kraus nicht weiter. Herr Kreckwitz ist nämlich nicht der Ansicht, dass wir »zu primitiv« sind, »uns von ihr bedienen zu lassen«.* Nein, er ist der Ansicht, dass die Maschine hochentwickelt genug ist, sich von uns bedienen zu lassen. Herr Kreckwitz hat nämlich Visionen einer Welt, in der sich der Geist in der Maschine aufgibt und nur noch Maschine werden sollte, um schreibregelbasierte Inhalte für andere Maschinen zu erstellen, damit »Markenwahrnehmungen« stärker werden.

In dieser entgeistlichten, markenwahrnehmungstechnisch optimierten Welt ist man arm dran. In ihr dürfte es weder ein Elektrizitätsversorgungsunternehmen noch Johannisbeerensaft geben. Denn diese Bezeichnungen wären zu lang oder wiesen zu viele Bedeutungseinheiten auf. Am besten gliedere man die Bezeichnungen auf, weil eine richtige Aufgliederung der jeweiligen Bezeichnungen eindeutig interpretierbar und gar nicht umständlich ist: Unternehmen zur Versorgung mit Elektrizität oder »Saft der Beeren des Johannes«. Aufgrund des Gebots zur Vermeidung des Schrägstriches – pardon, Schrägstrichs (ich wollte modern wirken) – hätten keine Zeitschriften für Juni/Juli erscheinen dürfen. Man dürfte auch nicht 120 km/h auf der Autobahn fahren oder aus dem beim Beck-Verlag erschienen ZPO-Kommentar von Thomas/Putzo zitieren. Soweit man maschinelle Übersetzungssysteme einsetzen möchte, haben Bedingungen ausschließlich mit »wenn« – nicht etwa mit »soweit«, »solange« oder »sofern« – eingeleitet zu werden. Schade. Artikellose Nominalphrasen wie »um Gottes Willen«, »für Hund und Katze«, »bei Vertragsabschluss« und Ähnliches sollen vermieden werden. (Nebenbei soll auch nichts gesagt werden und erst recht nicht im Passiv.)

Mit anderen Worten: Herr Kreckwitz hat Visionen einer Welt, in der die Ergebnisse von »DeepL & Co.« erst dann sehr beeindruckend werden, wenn man seine Software zur Autorenunterstützung einsetzt und auf die Fülle der Ausdrucksmöglichkeiten verzichtet, die sich für die Maschine als zu komplex erweist. Dabei sollen unter anderem die Aufgliederung mit Eindeutigkeit verwechselt und Unterschiede ignoriert werden. Herr Kreckwitz formuliert dies nur positiver: Zwecks maschineller Verwertbarkeit soll alles möglichst einheitlich gestaltet werden. (Er hätte nicht »möglichst einheitlich«, sondern »so einheitlich wie möglich« geschrieben, da er der Ansicht ist, das Wort »möglichst« sei ein zu vermeidender »Weichmacher«.) Das Einheitliche heißt bei Herrn Kreckwitz »eine einheitliche Kundenansprache« und diese Ansprache soll in nicht ganz nachvollziehbarer Weise »der Tone of Voice« sein; er schreibt wörtlich: »eine einheitliche Kundenansprache, der Tone of Voice«.

Auch wenn Herr Kreckwitz den Zusammenhang zwischen den beiden nie erläutert, soll so viel klar sein: Der Tone of Voice hat »ebenfalls unmittelbare Auswirkungen auf die Produktwahrnehmung«. Denn der »Tone of Voice kommuniziert Vorstellungen und Visionen eines Unternehmens«. … Und damit kommen wir der Sache näher. Auch das Unternehmen von Herrn Kreckwitz – Congree – hat Vorstellungen und Visionen.

Eine davon ist zweifelsohne die linguistische Intelligenz. Auf der Congree-Webseite kann man nämlich den Satz lesen, »Setzen Sie Ihre Ziele um und lassen Sie sich dabei von der linguistischen Intelligenz von Congree unterstützen«. Man kann sich ohne Weiteres aus dem Fenster lehnen, dass diese Intelligenz sowohl im Werbeartikel von Herrn Kreckwitz zwar nicht benannt, aber sehr wohl erläutert wird als auch dem vorstehenden Satz zugrunde liegt. Was Ersteres anbelangt: Da droht die linguistische Intelligenz in eine schreibregelbasierte Verblödung im Sinne der Maschine auszuarten; linguistic intelligence in this sense has nothing to do with speaking and writing intelligently; it has everything to do with dumbing down your language for the machine. Was Letzteres anbelangt: DeepL sollte aufgrund der diesem Satz zugrundeliegenden linguistischen Intelligenz eine sehr beeindruckende Übersetzung liefern.

Wenn man diesen Satz bei DeepL eingibt, wird die folgende Übersetzung ins Englische rausgespuckt: »Implement your goals and be supported by the linguistic intelligence of Congree«. Soweit Herr Kreckwitz von seiner schreibregelbasierten Art der linguistischen Intelligenz wirklich überzeugt ist und soweit er den Einsatz maschineller Übersetzungssysteme nicht nur öffentlich predigt, war die Übersetzung so sehr beeindruckend, dass Congree sie geändert hat – und nicht nur die Übersetzung des Verbs »umsetzen«, sondern auch durch Umstellung, Hinzufügung und Auslassung die Gesamtsyntax des Satzes – pardon, des Satzs (again ich wollte modern wirken). Die Übersetzung liest sich nun wie folgt: »Achieve your goals while being supported by Congree’s linguistic intelligence«. Beide Übersetzungen, die von DeepL und die von Congree geänderte, fallen jedoch flach und lesen sich umständlich, weil der Ausgangssatz entsprechend den elf Schreibregeln für Maschinen geschrieben und schließlich von einer Maschine vorübersetzt wurde. Nur eine Maschine wird den Ausgangstext und dessen Übersetzung mit Vergnügen lesen können.

Hinzu kommt: Beide Übersetzungen sind falsch. Denn sie geben den eigentlichen Kern der Werbeaussage nicht wieder; insbesondere wurde der Hauptbegriff der linguistischen Intelligenz falsch – weil nur orthographisch – übersetzt. Wie die deutschen Wörter »legend«, »familiär« und »aktuell« nicht mit den englischen Wörtern »legend«, »familiar« bzw. »actual« zu übersetzen sind, so ist auch der Begriff der linguistischen Intelligenz nicht mit »linguistic intelligence« zu übersetzen. Wie bei »legend«, »familiär« und »aktuell« muss auch der Begriff der linguistischen Intelligenz seinem Bedeutungsgehalt gemäß übersetzt werden. Demzufolge und gemäß dem eigentlichen Bedeutungsgehalt des Begriffs »linguistische Intelligenz« hieße diese Aussage richtig übersetzt wie folgt: »Blah blah blah goals and dumb down your language with Congree«.

Unterm Strich gilt also: »DeepL & Co.« sind höchstens »sophisticated and useful«, aber sie liefern keine sehr beeindruckenden Ergebnisse; sie liefern nicht einmal herkömmlich beeindruckende Ergebnisse. Wenn Konsequenz keine überflüssige Last werden soll, darf man ruhig zum folgenden Schluss kommen: Nicht einmal Herr Kreckwitz glaubt, dass »DeepL & Co.« sehr beeindruckende Ergebnisse liefern. Er will uns lediglich glauben machen, dass die Ergebnisse von DeepL & Co. so unbeeindruckend beeindruckend sind, dass wir seine Art der linguistischen Intelligenz unbedingt benötigen. Im Dienste der Maschine und seiner Verkaufszahlen zuliebe sollen wir glauben, dass dumbing down our language intelligent und im Sinne der Markenwahrnehmung ist, when it’s notnot in any sense of the word.

 

Endnote

* Siehe Karl Kraus, F 261–62: 1.

Diesen Beitrag per E-Mail weiterempfehlenDruckversion

Hinweise zur bestehenden Moderationspraxis
Kommentar schreiben

3 Kommentare

Kommentare als Feed abonnieren

Eine sehr informative Zusammenfassung. Danke, Peter Winslow. Weiß jemand, ob DeepL & Co oder "Google Translate" die Eingaben speichert? Die Versuchung ist groß, in diese Online-Masken vertrauliche Texte zur schnellen Übersetzung einzugeben.

Man sollte auf jeden Fall Namen und sonstige sensible Daten ersetzen/unkenntlich abkürzen.

Es gibt jedenfalls eine kostenpflichtige Variante deepl-Variante (für Unternehmen). Dort ist es, soweit ich weiß nicht erforderlich. In Abhängigkeit davon, wie oft und intensiv man es nutzt, ist das ggf. eine sinnvolle Alternative.

Deepl kann ich persönlich sehr empfehlen. Man muss zwar manchmal etwas verbessern, aber vergleichsweise selten. Ein Muttersprachler mag das kritischer sehen, aber selbst die Juristen, die länger im anglo-amerikanischen Raum gelebt haben oder primär auf Englisch arbeiten, sind ganz zufrieden. Google Translate hatte zumindest früher furchtbare Ergebnisse (habe es daher nie genutzt), würde ich aber - da es google ist- ohnehin nicht empfehlen. Deepl sitzt in Köln - was schon ein großes Plus ist- und liefert ziemlich gute Resultate.

0

Hallo Herr Dr. Spies,

DeepL hat sich mal, wenn ich mich nicht täusche, das Recht vorbehalten, zur Übersetzung eingegebene Texte zu speichern, und zwar zwecks Optimierung. Dies scheint nicht mehr der Fall zu sein. Laut Ziffer 3.6 der AGBs von DeepL wird DeepL

 Inhalte auf seinen Servern nur in dem Maße speichern, wie es für die Erbringung der Dienste technisch erforderlich ist. Inhalte des Kunden werden weder dauerhaft auf den Servern von DeepL gespeichert noch an den Kunden zurückgegeben. Zur Klarstellung: DeepL ist berechtigt, Zugangsprotokolle für Abrechnungs-, Sicherheits- und Statistikzwecke zu erstellen und aufzubewahren. Solche Zugriffsprotokolle dürfen keine Inhalte des Kunden enthalten. Zugriffsprotokolle können jedoch Metadaten von API-Anfragen enthalten, wie z.B. den Zeitpunkt der API-Anfrage und die Größe des übertragenen Inhalts.

Das dürfte zwar stimmen, aber man kann nicht ohne Weiteres feststellen, ob im Rahmen der Nutzung von DeepL Daten von einem Dritten gespeichert werden. Denn DeepL behält sich auch nach Ziffer 3.11 das Recht vor, »Dritte mit der Erfüllung ihrer vertraglichen Pflichten ganz oder teilweise zu beauftragen«, ohne die Fälle zu benennen, in denen eine solche Beauftragung möglich wäre. Ich unterstelle DeepL keine bösen Absichten; ich weise nur auf eine Ungewissheit hin.

Was Google Translate betrifft: Ich habe bisher sehr wenige Informationen zur Speicherungspolitik gefunden. Eine der klareren »Quellen« (ich weiß nicht, ob sie daher auch zuverlässig ist) ist diese Seite. Diese scheint tatsächlich eine anonymisierte Speicherung zwecks Optimierung zu bestätigen.

Kommentar hinzufügen