Werden menschliche ÜbersetzerInnen bald durch künstliche Intelligenz ersetzt?

AI and translation

Wie die Sprachbranche mit KI und Large Language Models umgeht

Sprache im ständigen Wandel

Im März 2023 kam eine Neuauflage des Oxford English Dictionary heraus. Dazu gehörte auch, dass über 700 neue Wörter und Redewendungen hinzugefügt wurden, sodass Begriffe wie „deepfake“, „chonky“ und „groomzilla“ zu einem Teil des anerkannten englischen Wortschatzes wurden. Ein weiterer Schwerpunkt der Neuauflage waren die weltweiten Varianten des Englischen, insbesondere die Anpassung der Aussprache der Māori, Schotten und Inder an den heutigen Sprachgebrauch.

Das Leibniz-Institut für Deutsche Sprache gab 2021 bekannt, dass es mehr als 1.200 neue Wörter gesammelt habe, die allesamt im Zusammenhang mit der Corona-Pandemie stünden. Zwischen 2019 und 2022 kamen in französischen Wörterbüchern mindestens 500 neue Wörter hinzu, von denen viele als Reaktion auf die Klimakrise und die Pandemie entstanden. Auch im Japanischen kamen 2022 neue Wörter hinzu, größtenteils mit Bezug auf aktuelle Ereignisse wie den Krieg in der Ukraine und das Klima. In Anerkennung der zunehmenden Verbreitung und kulturellen Bedeutung der Sprache erklärten die Vereinten Nationen im Jahr 2021 den 7. Juli zum Welt-Kisuaheli-Tag.

Doch die Wörterbücher und Organisationen holen im Moment nur auf: Wenn diese Veränderungen offiziell anerkannt werden, sind sie bereits Realität.

Sprache ist ständig in Bewegung. Die Wörter, die wir benutzen und wie wir sie benutzen, sind ständig im Wandel begriffen, und Sprachen entwickeln sich als Reaktion auf kulturelle Veränderungen und globale Ereignisse rasch weiter. Auch wenn oft von „sterbenden“ oder „florierenden“ Sprachen die Rede ist, die Wirklichkeit ist vielmehr, dass sie aufgrund von Veränderungen im menschlichen Verhalten aus der Mode geraten oder auch an Beliebtheit gewinnen bzw. wiederentdeckt werden.

Die Art und Weise, wie der Mensch Sprache einsetzt und weiterentwickelt, ist einzigartig. Unsere Fähigkeit, uns mit Worten zu verständigen und auszudrücken, in mündlicher wie in schriftlicher Form, unterscheidet uns von anderen tierischen Lebensformen auf der Erde. Unsere Sprache formt und wird geformt durch unsere wunderbare kulturelle Vielfalt und Fülle und spiegelt das menschliche Dasein in seiner ganzen Komplexität wider.

Wie kann es dann sein, dass Maschinen diese hoch entwickelte, komplexe und sich ständig verändernde Form der Kommunikation erfassen und sie genauso einsetzen können wie wir? Wie können Computer jemals auch nur annähernd gut genug verstehen, wie unsere Sprachen funktionieren, um zwischen ihnen zu übersetzen?

Die Strahlkraft von ChatGPT

In unserem letzten Blogbeitrag haben wir uns die jüngsten Entwicklungen im Bereich der generativen künstlichen Intelligenz (GenAI) vor allem in puncto Sprache genauer angesehen und beleuchtet, wie ChatGPT die Welt im Sturm erobert hat. Obwohl sich Technologien dieser Art bereits seit mehreren Jahren stetig weiterentwickeln, hat der von OpenAI entwickelte Online-Chatbot die Fantasie eines breiten Publikums beflügelt. Plötzlich reden alle darüber, wie beeindruckt sie von der Leistung von ChatGPT sind und wie Large Language Models (LLMs) dieser Art die Geschäftskommunikation und die Erstellung sprachlicher Inhalte im Allgemeinen revolutionieren werden.

ChatGPT wird sogar als besser als Google Translate und als Patentlösung für das altbekannte Problem des Übersetzens zwischen Sprachen angepriesen.

Wie gut ist GenAI denn nun im Übersetzen und sollten sich professionelle LinguistInnen Sorgen machen?

Bevor wir uns damit befassen, werfen wir einen kurzen Blick darauf, wie Technologie seit vielen Jahren im Sprachgeschäft eingesetzt wird und wie wir uns als Branche neue Übersetzungstechnologien für gewöhnlich zunutze machen.

ÜbersetzerInnen sind Early Adopters

Seit der Antike ist allgemein bekannt, wie wertvoll die Übertragung von Inhalten von einer Sprache in die andere wirklich ist – und die Suche nach einer möglichst effizienten Methode hierfür ist nach wie vor in vollem Gange. Die Entlastung des menschlichen Übersetzers oder Dolmetschers steht in der Welt der Übersetzung schon seit langem hoch auf der Agenda. Könnte man sogar behaupten, dass der Stein von Rosette, die antike Stele aus dem Jahr 196 v. Chr. mit Inschriften in 3 Sprachen, eine frühe Version von Übersetzungstechnologie war?

Spätestens seit IBM in den 1950er Jahren erstmals 60 russische Sätze per Computer ins Englische übersetzte, ist das Rennen um die Entwicklung einer Maschine, die den Menschen ersetzen soll, ein großes Thema. Von regelbasierter maschineller Übersetzung bis hin zu statistischer und neuerdings auch neuronaler MÜ: Die Forschung läuft auf Hochtouren und macht stetige Fortschritte.

Darüber hinaus haben ÜbersetzerInnen und Übersetzungsagenturen die Hilfsmittel, die es gab, immer schnell angenommen.

Das digitale Zeitalter hat rasante technologische Fortschritte mit sich gebracht. ÜbersetzerInnen mussten sich zuerst an elektronische Wörterbücher und Glossare gewöhnen, dann an web- und Cloud-basierte Translation-Management-Systeme, heute an die maschinelle Übersetzung auf Basis neuronaler Netzwerke. Diese Technologien haben dazu beigetragen, dass die zugehörigen Prozesse optimiert und beschleunigt wurden und den Kunden ein gutes Preis-Leistungs-Verhältnis geboten wird.

CAT, TMS und MÜ

Bereits heute stehen ÜbersetzerInnen hochmoderne Tools zur Verfügung.

Sogenannte CAT-Tools („computer-aided translation“, dt. computergestützte Übersetzung) bieten auf vielerlei Weise Unterstützung. Sie speichern zuvor übersetzten Text ab und füllen Zieltextsegmente automatisch aus, die vollständig mit diesem übereinstimmen. Sie enthalten projektspezifische Termbanken, stellen zusätzliche Informationen von anderen ÜbersetzerInnen oder ProjektmanagerInnen bereit und bieten eine einheitliche Übersetzungsumgebung für verschiedene Dateiformate. Mit anderen Worten: Sie tragen viel dazu bei, dass die Arbeit zusammenhängender und systematischer wird.

Ein Translation Management System (TMS) vernetzt alle an einem Sprachprojekt beteiligten Teams; in einem TMS können KundenbetreuerInnen, DienstleisterInnen, ProjektkoordinatorInnen und ÜbersetzerInnen auf alle wichtigen Informationen zugreifen. Ein TMS lotst ein Projekt vom Kostenvoranschlag bis zur Lieferung der fertigen Übersetzung und bietet die Möglichkeit, Projekte in großem Maßstab für verschiedene Sprachpaare und Märkte zu verwalten.

Maschinelle Übersetzung wird in der Sprachbranche inzwischen vielfach eingesetzt. Das Aufkommen neuronaler Netzwerke Mitte der 2000er Jahre hat dazu geführt, dass maschinelle Übersetzungssysteme genauer geworden sind, und in den letzten zehn Jahren hat sich MÜ bei bestimmten Texten und Projekten zu einem brauchbaren Mittel für professionelle Übersetzungen gemausert. Die Prämisse der maschinellen Übersetzung besteht darin, dass sie Übersetzung ohne Input eines menschlichen Linguisten erstellen kann.

Technologie ist so eng mit der Sprachbranche verknüpft, dass viele Unternehmen je nach Fachgebiet ihre eigenen Tools entwickeln. t’works hat eigene spezifische Technologie-Tools für das Terminologiemanagement, SAP-Übersetzungen und als Bindeglieder zu CMS-Systemen entwickelt, die allesamt darauf ausgelegt sind, die Projekte unserer Kunden so effizient und nahtlos wie möglich abzuwickeln.

Die Sprachbranche kann somit eine erstklassige Erfolgsbilanz bei der Integration von Technologien in ihre Workflows vorweisen. Sie integriert seit jeher bereitwillig Systeme, die Produktivität und Qualität verbessern – Umbrüche werden mit offenen Armen empfangen!

GenAI und Übersetzung

Ungeachtet der Bedenken rund um Datenschutz und Datensicherheit, die wir in unserem letzten Blogeintrag angesprochen haben, sehen wir uns doch einmal genauer an, wie gut GenAI-Angebote wie ChatGPT im Übersetzen sind und ob sie angesichts ihrer jetzigen Beschränkungen, wie der Neigung zum „Halluzinieren“ und den inhärenten Verzerrungen, überhaupt eine brauchbare Übersetzungsoption darstellen.

Tests aus verschiedenen zuverlässigen Quellen sind zu ähnlichen Ergebnissen gelangt. Die SprachtechnologieexpertInnen von CSA Research haben sich eingehend mit dieser Frage befasst. Sie kommen zu dem Schluss, dass ChatGPT „auffallend gute Ergebnisse“ erzielt, wenn für die jeweiligen Sprachen große Datenmengen als Trainingsmaterial verfügbar sind (ressourcenreich), während es bei ressourcenarmen Sprachen weniger gut abschneidet. Außerdem stellten sie fest, dass ChatGPT bei Aufgaben, die „verrauschte“ Daten beinhalten (d. h. Text, der ggf. Rechtschreibfehler oder viele umgangssprachliche und ungewöhnliche Ausdrücke enthält), stärker abschneidet als aktuelle MÜ-Angebote und dass es den Kontext besser erfasst. Die Möglichkeit, für komplexere Anweisungen an das System Prompts zu verwenden, wurde ebenfalls als Pluspunkt angesehen.

Das Fachportal für Sprachdienstleister Slator berichtete auf Basis einer Analyse aktueller Studien von Tencent, Intento und Microsoft, dass alle drei ChatGPT als „wettbewerbsfähig“ bewerteten, was Übersetzungen in ressourcenintensiven Sprachen angeht. Laut den Erkenntnissen der Sprachberatungsagentur Nimdzi sind generative KI-Sprachmodelle (wie ChatGPT) zwar flüssiger als neuronale MÜ, aber auch ungenauer und unvorhersehbarer. Allerdings kam Nimdzi auch zu dem Schluss, dass es für diese KI-Modelle viel mehr Anwendungsmöglichkeiten gibt als für herkömmliche MÜ, insbesondere in Bereichen wie Transkreation oder Erkennung von geschlechtsspezifischen Verzerrungen.

Diese Bewertungen sind hilfreich, doch dabei ist zu bedenken, dass sie die Übersetzungsfähigkeit der generativen KI weitgehend mit der bestehenden maschinellen Übersetzung vergleichen, die selbst alles andere als perfekt ist. In allen Fällen haben sowohl KI-Sprachmodelle als auch MÜ noch erhebliche Schwächen und einen sehr langen Weg vor sich, bis sie den Menschen ersetzen können. Um Arle Lommel von CSA Research zu zitieren: Die Qualität der Übersetzung von ChatGPT „hängt von der Sprache ab, von der Materie und manchmal auch von der Mondphase oder einem anderen unberechenbaren Faktor.“

Kundenvorteile

Man kann mit Fug und Recht behaupten, dass ChatGPT die Sprachbranche auf Trab hält. Es ist ein weiterer Disruptor in einem Sektor, der in seiner Geschichte ständig dem technologischen Fortschritt unterworfen war. Im Augenblick sind seine Übersetzungsfähigkeiten zwar gut, aber nicht gut genug für Übersetzungen wichtiger Inhalte. Wenn Sie wichtige Geschäftstexte, Literatur, zielgerichtete Marketingtexte oder Ähnliches übersetzen lassen möchten, ist menschliches Fachwissen unerlässlich. ChatGPT kann ein nützliches Hilfsmittel sein, wenn man einen Text in einer anderen Sprache grob verstehen möchte oder nach Ideen für Inhalte sucht, doch zum jetzigen Zeitpunkt ist es noch zu fehlerbehaftet, um wichtige Übersetzungsarbeiten selbstständig zu erledigen.

Welche Rolle es genau spielen wird, ist noch ungewiss. Was wir wissen, ist, dass generative KI die Technologielandschaft verändert und man sie nicht einfach ignorieren kann. Vorerst hoffen wir, dass diese unglaubliche Technologie allen Unkenrufen zum Trotz einen positiven Einfluss auf die Welt der Sprache und die Menschen, die sie bevölkern, haben wird. Für diejenigen von uns, die von Beruf mit Worten jonglieren, nun ja, wir bleiben weiterhin offen für neue technologische Hilfsmittel, sofern sie unseren Kunden direkte Vorteile bringen.

Ihr(e) persönliche(r) Ansprechpartner:in

Marie-Laure Vinckx

Abonnieren Sie unseren Newsletter

Bleiben Sie mit unseren Newsletters auf dem aktuellen Stand zu unseren Veranstaltungen und Projekten.