DeepL: zwischen Pest und Cholera und sonstigem Unfug

von Peter Winslow, veröffentlicht am 28.04.2023

DeepL wirbt mit Sätzen wie: Seine KI könne »selbst die feinsten sprachlichen Nuancen erfassen und in der Übersetzung wiedergeben«. Seine KI erziele »Rekordergebnisse in wissenschaftlichen Benchmarks« (ebenda). »Auch in Blindtests bevorzugen Übersetzer die Ergebnisse von DeepL dreimal so häufig wie die [von Google, Amazon und Microsoft]« (auch ebenda). Bei der Wahl zwischen Pest und Cholera bevorzuge ich Cholera, aber meiden will ich sie beide.

Aufgrund dummer Logik und unbestimmter Begriffe wie »sprachliche Nuancen« und »wissenschaftliche Benchmarks« erwecken diese Werbesätze den Eindruck, dass sie nicht der Überzeugung dienen. Bei diesen Sätzen ist die Euphorie die Botschaft. Man sollte sich von der Anzahl, von der Steigerung, von dem Kauderwelsch der Sätze mitreißen lassen, die feinsten sprachlichen Nuancen, Rekordergebnisse in wissenschaftlichen Benchmarks, in Blindtests dreimal so häufig bevorzugt. Im Äther des Internets werden die Sätze so aneinandergereiht, dass man zwischen der Lektüre des einen und der Lektüre des nächsten keine Zeit hat, sich vom gesunden Menschenverstand aufhalten zu lassen. In der Euphorie des Mitreißens sollte man die Größe der Versprechen dieser Sätze mit der Größe der Leistungsfähigkeit seiner KI verwechseln.

Von dieser Verwechslung lebt DeepL. Seine Abonnentenzahl lebt davon, wie viele ihm wie lange glauben. Die besseren Argumente hat DeepL nicht. DeepL hat nicht einmal ein Argument. DeepL bietet nur leere Behauptungen und dumme Logik. Außer dem Blindtest führt DeepL keinen Nachweis für die oben angeführten Sätze. Was sind diese »feinsten sprachlichen Nuancen«? Was sind diese »Rekordergebnisse«? Was die »wissenschaftlichen Benchmarks«? Es kann nichts Gutes heißen; auch die Pest hat Rekordergebnisse erzielt. Untermauert wird diese Vermutung durch den Umstand, dass nicht einmal DeepL an die eigene Werbung glaubt. Was DeepL in der Werbung lobt, widerspricht DeepL im Blog.

Am 11. April 2023 veröffentlichte DeepL einen Blogbeitrag mit dem Titel »KI-Übersetzung: Ein Muss für Anwaltskanzleien mit internationalen Klienten«. Das ist kein Witz. So eine feine sprachliche Nuance möchte ich niemandem unterstellen. Schauen Sie selbst nach. Da steht das Wort »Klienten«. Aber warum? Man kann nur spekulieren. Denn DeepL trifft die richtige Wortwahl gleich im ersten Satz des Beitrags, »Anwaltskanzleien, die mit internationalen Mandanten«. Überhaupt könne die DeepL-KI die feinsten sprachlichen Nuancen so gut erfassen, dass sie keine konsistenten Übersetzungen erstellen könne. Wörtlich steht:

Die Glossarfunktion von DeepL ist für Juristen ein wichtiges Tool, da sie damit ihre eigene Terminologiedatenbank erstellen und verwalten können. Indem die Übersetzung bestimmter Wörter und Wendungen im Voraus festgelegt wird, wird sichergestellt, dass Texte immer konsistent übersetzt werden.

DeepL trägt das Herz auf der Zunge. Ohne Glossare und Menschenhilfe wird nicht sichergestellt, dass Texte immer konsistent übersetzt werden. Oder positiv ausgedruckt: Die feinsten sprachlichen Nuancen können nur mit Glossaren und Menschenhilfe erfasst werden. Daher biete DeepL ein vom Menschen zu pflegendes Glossar an, das helfe, die von DeepL zu erwartenden »Fehler und Missverständnisse zu vermeiden«. Oder anders gesagt: DeepL ist der heutige »Schachtürke«; das ganze automatisierte Spiel funktioniert nur, wenn ein Mensch drin steckt.

Ohne Menschen und ohne vom Menschen gepflegte Glossare bestehen die von der DeepL-KI erfassten sprachlichen Nuancen, die feinsten wie die anderen, in Inkonsistenzen. Die Nuancen entlarven sich – selbst bei Wunschdenken und Wollwollen – höchstens als lexigrafische Synonyme, die nolens volens zusammengefügt werden. Man kann sie nicht anders verstehen. Und solche Nuancen braucht kein Mensch.

Soll man wirklich glauben, dass ein Glossar mit Wörtern und Wendungen den feinsten sprachlichen Nuancen, diesem Übel der wilden Synonymfindung, entgegenwirkt? Ein Glossar kann helfen. Kein Zweifel. Aber was ist mit den Wörtern und Wendungen, die nicht im Glossar enthalten sind? Auch DeepL muss zugeben, dass diese diesem Übel ausgesetzt sind. Denn ein Glossar kann nicht jedes Wort, nicht jede Wendung enthalten; ein Text ist kein Lager, ein Glossar keine Inventarliste, eine Übersetzung kein Wortbestand. Und weder die Richtigkeit noch die Vollständigkeit einer Übersetzung hängt nur vom Zählen ausgangssprachlicher Worte und Wendungen und vom Ersetzen dieser durch zielsprachliche Worte und Wendungen ab. Glossare hin oder her. In Wahrheit sind Zählen und Ersetzen nur ein kleiner Teil vom Übersetzen. Sie sind auch nicht der interessanteste Teil. Der interessante Teil sind die langwierigen Bewegungen vom Zählen zum Denken, vom Denken zur Entscheidungsfindung.

Aber DeepL will nicht, dass man denkt. DeepL will Jurist:innen glauben machen, dass sie auch ohne entsprechende Ausbildung und ohne entsprechende Fachkenntnisse übersetzungstechnische Terminologiearbeit leisten können. DeepL setzt darauf, dass Jurist:innen diese versuchte Glaubhaftmachung leichtgläubig und ohne Verständnis glauben. Auf der einen Seite sollten Jurist:innen glauben, dass Übersetzer:innen Mitglieder der Freien Berufe sind – Berufe, die »im allgemeinen auf der Grundlage besonderer beruflicher Qualifikation oder schöpferischer Begabung die persönliche, eigenverantwortliche und fachlich unabhängige Erbringung von Dienstleistungen höherer Art im Interesse der Auftraggeber und der Allgemeinheit zum Inhalt« haben (§ 1 PartGG). Auf der anderen Seite sollten Jurist:innen – die zwar für vieles, aber nicht für ihre schöpferische Begabung bekannt sind – glauben, dass sie ohne besondere berufliche Qualifikation eine Übersetzungsdienstleistung, die Terminologiearbeit, erbringen können. Es ist beleidigend.

DeepL will nicht, dass man seine Texte tiefer als die Oberfläche untersucht. Das gilt für seine Werbung, deren Botschaft die Euphorie ist und an die DeepL nicht einmal glaubt und die Werbesätze enthält, deren Nachweise entweder dumme Logik oder Nichts ist. Das gilt für seinen Blogbeitrag, der ein Paradox der menschenbedingten Automatisierung vertuscht und der Glossare als Allkonsistenzmittel lobpreist und mit dem DeepL Jurist:innen für leichtgläubig und dumm verkaufen will. Aber das gilt auch für seine Allgemeinen Geschäftsbedingungen. In Ziffer 3.1.7 steht wörtlich:

DeepL ist berechtigt, Dritte ganz oder teilweise mit der Erfüllung ihrer vertraglichen Pflichten zu beauftragen.

Auf den ersten Blick ist diese Ziffer unauffällig. Allem Anschein nach kommt diese Ziffer einer gängigen Vertragsklausel gleich. Aber das Pronomen ist falsch. Und das ist kein Woke-Wahnsinn. Für seine Allgemeinen Geschäftsbedingungen hat sich DeepL »sein« als sein Wahlpronomen ausgesucht – daher wurde auch dieses Pronomen für DeepL in diesem Beitrag verwendet. Lesen Sie etwa Ziffer 3.1.2, in der die eindeutigste Verwendung dieses Pronomens vorkommt:

DeepL speichert Inhalte oder Verarbeitete Inhalte auf seinen Servern nur in dem Umfang, der für die Bereitstellung der Produkte technisch erforderlich ist. […] [Hervorhebung diesseits]

Natürlich darf man nicht an dem buchstäblichen Sinne des Ausdrucks haften; man muss den wirklichen Willen erforschen. Aber wie? DeepL verwendet unbestimmte Begriffe, widerspricht sich und weigert sich am Standard-Sprachgebrauch zu beteiligen. Wie sollte man den wirklichen Willen von DeepL erforschen? Man kann nur davon ausgehen, dass DeepL weder klare Begrifflichkeiten noch Widerspruchsfreiheit noch Standard-Sprachgebrauch will. Sein wirklicher Wille ist also unklar. In Ziffer 3.1.7 scheint DeepL widersinnig berechtigt sein zu wollen, »Dritte ganz oder teilweise mit der Erfüllung ihrer vertraglichen Pflichten zu beauftragen«.

Nun ist man zu dem Schluss gezwungen, dass mindestens diese Ziffer 3.1.7 seiner Allgemeinen Geschäftsbedingungen wegen Unsinnigkeit unwirksam ist, dass seine Werbung an einem Glaubwürdigkeitsproblem leidet und dass seinem ganzen automatisierten Spiel ein Paradox innewohnt. Wenn DeepL nur offen und ehrlich mit den Schwächen und Mängeln seiner KI umgehen würde, hätte man wahrlich kein Problem mit DeepL. Man hätte die Unsinnigkeit der Ziffer 3.1.7 etwa einem Flüchtigkeitsfehler zuschreiben können. Das kann ja jeder und jedem passieren. Aber nein. Die Unsinnigkeit liegt tiefer als Flüchtigkeit. Sie ist systematisch.

Der Wunsch, neben Wahrheit auch Klarheit in der Werbung, neben Klarheit auch Ehrlichkeit im Blogbeitrag zu haben, ist kein Scherz. Ein Scherz ist auch nicht der Wunsch, allgemeine Geschäftsbedingungen von einer unfreiwillig komischen Widersinnigkeit befreit zu wissen. Ein Scherz, um mit Karl Kraus zu reden, ist »der Glaube an die Erfüllbarkeit« dieser Wünsche. Bis dieser Glaube kein Scherz mehr ist, darf ich hoffen, dass Sie sämtliche Texte von DeepL vorsichtig lesen.

– Nachtrag –

Ich darf hinzufügen: Verwenden Sie das DeepL-Übersetzungsangebot, wenn Sie müssen. Ich habe wirklich nichts dagegen. Aber versuchen Sie nicht, mich davon zu überzeugen, dass DeepL die feinsten sprachlichen Nuancen erfasst oder dass DeepL »präzise[], kontextbezogene[] und natürlich klingende[] Übersetzungen« liefert, wie im hier besprochenen DeepL-Blogbeitrag gelogen wird. Zum Beweis der Lüge biete ich die DeepL-Übersetzung des ersten Absatzes eines meiner Beiträge aus der beck-community. Diese DeepL-Übersetzung lautet wie folgt:

The Law on Court Interpreters (GDolmG) - it is hard to imagine a more questionable law. The GDolmG is questionable not because it cannot fulfill its own purpose of establishing uniform standards for court interpreters, as the Federal Council states.[1] Not because it implements a standardization idea "only half-heartedly".[2] Not because the new law introduces a new confusion into social life, a standardization without uniformity. Not because it causes a coexistence of federal and state law for one and the same historically treated professional group.[3] No, the GDolmG is questionable not because of legislative incoherence nor because of half-hearted implementation of an idea nor because of the introduction of a new confusion nor because of unnecessary unequal treatment of a professional group. Stupid laws may presumably exist. The GDolmG is questionable because it is unlikely to be constitutional.

Ist diese »Übersetzung« präzise? kontextbezogen? Nein. Wer die öffentlichen Debatten zum GDolmG verfolgt, weiß, dass diese »Übersetzung« überwiegend falsch ist und den Kontext nicht oder nicht richtig widergibt. Klingt diese »Übersetzung« natürlich? Nein. Der krasseste Nachweis ist dies: »Not because it causes a coexistence of federal and state law for one and the same historically treated professional group« [Hervorhebung diesseits]. Wer einen etwas tieferen Einblick in die Probleme mit dieser »Übersetzung« bekommen möchte, kann hier klicken – ein von mir verfassten Beitrag auf LinkedIn.

Diesen Beitrag per E-Mail weiterempfehlenDruckversion

Hinweise zur bestehenden Moderationspraxis
Kommentar schreiben

1 Kommentar

Kommentare als Feed abonnieren

Wir haben eine nichtkommerzielle Fachveröffentlichung mit 1,8 Millionen Worten (2 Bücher im Atlantenformat).

Deepl übersetzt diese automatisch aus dem Deutschen ins Englische. Englischsprachige Muttersprachler aus dem Fach, um das es geht, finden dabei durchaus einiges, was verbessert werden kann - bestätigen uns aber, dass die Übersetzung lesbar und verständlich ist, und dass auch Muttersprachler erst ein bisschen lesen müssen, bis sie merken, dass es automatisch übersetzt wurde. 

Und das für ein paar hundert Euro je Übersetzungsdurchgang, anstatt eines knapp sechsstelligen Betrages, den eine manuelle Übersetzung kosten würde.

Ich finde, man sollte die Kirche im Dorf lassen. Was Deepl da geschafft hat, war vorher schlicht nicht möglich, und auch heute ist die Konkurrenz abgeschlagen.

Dass das immer noch nicht perfekt ist, ist richtig. Es verringert aber den Übersetzungsaufwand um Dimensionen. 

0

Kommentar hinzufügen