Maschinelle Übersetzungssoftware für »legale Übersetzungen«

von Peter Winslow, veröffentlicht am 14.12.2021

Am 15. November 2021 gab Tilde – ein Unternehmen, dessen Leidenschaft Sprache sei – »8 Wege zur Umwandlung juristischer Übersetzungen mit Hilfe maschineller Übersetzungen« bekannt. Man tue dem Unternehmen den Gefallen, nicht an der Ernsthaftigkeit dieser Überschrift zu zweifeln. Sie ist das Ergebnis der unternehmenseigenen maschinellen Übersetzungssoftware (siehe Bild, oben links) und dient dem Nachweis – oder hat man hier etwas anderes anzunehmen? – dass Tilde in der Lage ist, gute maschinell erstellte Übersetzungen im Bereich der juristischen Fachübersetzung zu liefern.

Die Herstellerinnen maschineller Übersetzungssoftware glauben an eine moderne Zauberkunst. Sie glauben, dass ihre maschinelle Übersetzungssoftware durch Wiederholungen eigener Überzeugungen besser wird: Je öfter man sage, wie gut die eigene maschinelle Übersetzungssoftware sei, desto besser werde diese Software. Gesagt, getan – oder nicht. Es ist eine seltsame Erscheinung. Vorliegend verhält es sich nicht anders. Unter der Überschrift »Kundenspezifische Übersetzungsmotoren für legale Übersetzungen« liest man Sätze wie »[d]ie Richtigkeit is alles« oder »Tildes übliches MÜ-System liefert genaue Übersetzungen, die auf den Rechtsbereich und die Terminologie zugeschnitten sind«.

In Wahrheit besteht die Zauberkunst dieser Herstellerinnen darin, dass man über jede Fehlübersetzung hinwegsieht. Die Qualität maschinell erstellter Übersetzungen soll man zwar anhand von Wörtern feststellen, aber nicht anhand der in der Übersetzung enthaltenen, sondern anhand der werblichen. Unsere Aufmerksamkeit wird gelenkt. Wir sollen aufs Maul schauen, um uns von der Qualität einer Software überzeugen zu lassen.

Das ist alles sehr unterhaltsam. I guess. Wer hätte nicht gerne eine auf die Terminologie zugeschnittene »legale Übersetzung«? Übersetzungen haben jedoch mit Fremdwörtern, nicht mit Fremden zu tun. Sie sind nicht legal oder illegal da. Die Richtigkeit eines von einem »Übersetzungsmotor« getriebenen Ergebnisses scheint dem Zufall geschuldet; auch eine kaputte Uhr ist zweimal am Tag richtig. Maschinelle Übersetzungssoftware ist besser geworden. Kein Zweifel. Aber sie ist nur besser, sie ist nicht gut geworden; eine kaputte Uhr ist sie noch.

Und keine eignet sich für juristische Fachübersetzungen, die mandatsbedingt richtig und vollständig sein müssen. Selbst eine maschinelle Übersetzungssoftware, die speziell für juristische – sorry, für legale – Übersetzungen entwickelt wurde, eignet sich nicht für juristische Fachübersetzungen, die mandatsbedingt richtig und vollständig sein müssen. Der Beweis? Diese Ergebnisse, die Werbung.

Diesen Beitrag per E-Mail weiterempfehlenDruckversion

Hinweise zur bestehenden Moderationspraxis
Kommentar schreiben

7 Kommentare

Kommentare als Feed abonnieren

Meine spontane Lieblingsstelle: "Der Rechtssektor schnüffelt weiterhin weltweit", irritierenderweise für "continues to snowball". Da sollte man doch meinen, sie hätten den Vorführtext so gestaltet, dass die Vorzüge ihrer Software hervortreten. Irritierend ist auch, dass es Mal "legale Übersetzungen" und Mal treffend "juristische Übersetzungen" heißt.
Auch ein juristisch geprägtes Vokabular macht offensichtlich noch keine Übersetzung, wie in den 90-ern, wo Übersetzungsmaschinen, die naheliegender Weise mit computerorientierten Vokabeln gefüttert waren, Sachen ausspuckten, wie: Im Mittelalter hielten die Menschen die Erde für eine Diskette...

Die Stelle gefällt mir auch ganz gut. Zunächst dachte ich, man hätte es hier mit absichtlicher Unsinnsdichtung zu tun. Bei Unsinnsdichtung können Unsinn und Stabreim Hand in Hand gehen – to good effect. Dann dachte ich, Malapropismen oder Verballhornung? ——Überhaupt hat es etwas gedauert, bevor mir klar war, dass die Übersetzung ernst gemeint ist. Next they'll want to tell us the perpendiculars!

Jedem vernünftigen Menschen ist klar, dass man sämtliche Produkte künstlicher Intelligenz lektorieren muss. Das gilt bei Spracherkennungs- und Texterkennungssoftware ebenso wie bei maschinellen Übersetzungen. KI kann (derzeit noch) nur helfen, aber keine Sicherheit bieten.

0

Sie haben Recht. Leider erwecken MÜ-Anbieter:innen immer wieder durch Werbesprüche den Eindruck, dass MÜ die Anforderungen professioneller Übersetzung erfüllen könnte.

So wirbt Systran mehr oder minder damit, Systran behauptet dies zwar nicht explizit, möchte aber, dass die Lesenden selber darauf kommen. So wirbt DeepL damit, DeepL sei »a machine translation system that, according to blind tests, achieves the best translation quality worldwide« – die beste Übersetzungsqualität weltweit, nicht die beste maschinelle Übersetzungsqualität weltweit. Der Spruch ist die beste Übersetzungsqualität weltweit. Das ist offensichtlich falsch, wie Sie – wenn ich Sie richtig verstehe – auch gerne zugeben würden. 

Diese Werbesprüche werden zwar immer, oder fast immer, im Rahmen weiterer Texte abgeschwächt, aber diese stehen immer ganz am Anfang jedes dieser Texte. Die Absicht ist klar: Interessenten davon zu überzeugen, dass MÜ die beste Übersetzungsqualität weltweit anbietet bzw. dass MÜ die Anforderungen professioneller Übersetzung erfüllt. Diese Sprüche stellen keine Appelle an die Vernunft dar. Sie präsentieren die Leistungsfähigkeit von MÜ als Qualitätsangebot, nicht als Hilfestellung.

Und weder Uni-Professoren noch Politiker helfen.

Es gibt englische juristische Sätze, die auch der beste menschliche Übersetzer nicht richtig übersetzen kann und eine maschinelle Übersetzung wirklich ebenso gut ist, z. B. "A well regulated Militia, being necessary to the security of a free State, the right of the people to keep and bear Arms, shall not be infringed", vgl. https://www.sueddeutsche.de/politik/waffenbesitz-us-verfassung-1.3986945.

0

Eine ganz faszinierende Sache gibt es aber bei der von mir oben zitierten Stelle insoweit, als die Software die grammatikalische Konstruktion ohne mir erkennbare (fach-)sprachliche Notwendigkeit wechselt und damit den sprachspezifischen Gepflogenheiten entgegenkommt. So hätte man die englische, verbale Konstruktion (continues to) auch im Deutschen abbilden können (fährt fort, exponentiell zu wachsen) und die deutsche adverbiale (oder watt is satt?) Version im Englischen (continually oder so was), aber die gefundenen Versionen kommen den Erwartungen näher, oder?
Ich fände es spannend zu wissen, wie so etwas algorithmisiert wird. Bietet die Software auch die in der deutschen juristischen Fachsprache so gerne gewählten Substantivhäufungen, besonders im Genitiv? Gibt es Indikatoren, wonach entschieden wird, ob die Konstruktion beibehalten oder gewechselt wird?

Ich kenne die Technik nicht zu 100%, aber so viel kann ich sagen:

1) MÜ-Systeme werden mit einem sog. Korpus »trainiert«. Dieser Korpus besteht regelmäßig aus Texten, die in zwei oder mehreren Sprachen vorliegen (denken Sie an EU-Richtlinien und Ähnliches). Diese Systeme sind sog. neuronalen Netzwerken, die vom Deep Learning profitieren. Das Model ist mehr oder minder das menschliche Gehirn, samt Teilung/Schichten etc. Hier ist eine Wiki-Erklärung, falls das hilft.

2) Sobald der Korpus eingespielt wird, weiß man nicht, was aus ihm wird. In diesem Zusammenhang spricht man gerne von dem MÜ-System als »Black Box«. Man kann nicht mehr reingucken, gleichsam unter die Haube gucken, und feststellen, wie das MÜ-System nunmehr funktioniert.

3) Man kann bestimmte Algorithmen erstellen, die bestimmte Funktionen ausführen: Wortwahl, Satzbau etc. (Ich gebe nicht an, dies gut zu verstehen; es wurde mir vor Jahren einmal erklärt, aber ich bin kein Informatiker udn habe mehr als die Hälfte vergessen).

4) Aber: Man kann ein MÜ-System mit weiteren Techniken ergänzen: etwa Translation Memories und Glossare. Und man kann das System so einstellen, dass es etwa erst die Translation Memories durchsucht, dann die Glossare und dann selbst übersetzt.

5) Der Korpus sowie die Translation Memories und Glossare bestimmen zum großten Teil, wie übersetzt wird. Je besser der Korpus, Translation Memories und Glossare, desto besser die Übersetzungen. Das ist die Theorie jedenfalls.

Der Wechsel in der Konstruktion, von dem Sie reden, ist wahrscheinlich dem Training (Korpus) und etwaigen Ergänzungen (TMs/Glossare) zu verdanken. Ob es weitere Idikatoren gibt, kann man nicht ohne Weiteres sagen. Das müsste Tilde sagen können. Tilde hat das Ding ja vermutlich trainiert. ——Hinzu kommt: KI liest sich schlecht, sobald ein Fachtext ins Spiel kommt. Übersetzer:innen haben sogar einen Spruch dafür: »Liest sich wie KI«. Der Satzbau, die Wortwahl kann bizarr sein, die Fehler unerklärlich.

 

Kommentar hinzufügen

/