In einem unserer früheren Blogbeiträge hatten wir kurz darauf eingegangen, Wie künstliche Intelligenz lernt,Deep Learning erwähnen. Zur Erinnerung: Deep Learning lernt und trifft Entscheidungen mithilfe eines sogenannten neuronalen Netzwerks. Neuronale Netzwerke sind eine sehr grobe Nachbildung des menschlichen Gehirns und der Funktionsweise des menschlichen Denkens. Die Knotenpunkte des Netzwerks nehmen Informationen von anderen Knotenpunkten auf, verändern sie und geben sie weiter. Lernen und Entscheidungsfindung sind das Ergebnis einer enormen Anzahl sich ständig verändernder Verbindungen und nicht das Ergebnis von Rechenoperationen, die Menschen ihnen auftragen, wie es bei anderen Lernmethoden der Fall ist.
Verarbeitung unstrukturierter Daten
Wie alle KI-Lernmethoden benötigt Deep Learning möglichst große Datenmengen. Im Gegensatz zu anderen Lernmethoden können dies auch unstrukturierte Daten sein, d. h. Bilder, Texte, Sprachdateien usw., deren Informationsgehalt nicht in einer geordneten Form wie beispielsweise einer Tabelle vorliegt. Bei den anderen Lernmethoden sortieren Menschen die Daten sozusagen im Voraus und unterteilen den Informationsgehalt in Kategorien wie „Hund“ und „Katze“. Das Lernen besteht dann darin, dass das System die Merkmale herausfindet, die „Hund“ und „Katze“ unterscheiden, diese Merkmale selbstständig auf neue Daten anwendet und die Erkennung schrittweise verfeinert. Deep Learning erfordert keine Spezifizierung des Informationsgehalts der Daten, der dann vom neuronalen Netzwerk selbst abgeleitet wird.
Diese Art des Umgangs mit unstrukturierten Daten prädestiniert Deep Learning für den Einsatz in hochkomplexen Anwendungsbereichen. Dazu gehören die Text- und Bildsuche in Suchmaschinen, autonomes Fahren, aber auch die Übersetzung von Texten. Eines der bekanntesten Tools für diesen Zweck trägt die Lernmethode in seinem Namen: DeepL.
Wie Übersetzungstools funktionieren
Ohne Training funktioniert nichts, nicht nur für menschliche Übersetzer, sondern auch für Übersetzungstools. Unabhängig davon, auf welcher Grundlage die Tools lernen und arbeiten, müssen sie zunächst anhand einer enormen Menge bereits übersetzter Satzpaare in der Ausgangs- und Zielsprache trainiert werden. Daraus bilden sie das Grundgerüst für Vokabular und Grammatikstrukturen. Anschließend schlagen die Tools eine Übersetzung vor und reagieren auf menschliches Feedback, indem sie kontinuierlich „gute” Übersetzungen beibehalten und „schlechte” verwerfen. Sie verwenden statistische Verfahren, um aus der Vielzahl der Möglichkeiten die richtige Übersetzung zu ermitteln.
Was Deep Learning besser kann
Jeder von uns weiß, dass der Kontext, also die Situation oder Umgebung, entscheidend für das Verständnis einer Handlung oder Äußerung ist. Auch für die Qualität einer maschinellen Übersetzung ist es von Bedeutung, ob und inwieweit der Wortkontext berücksichtigt wird – je mehr, desto besser. Genau hier liegt der entscheidende Unterschied zwischen herkömmlichen Übersetzungstools und solchen, die Deep Learning nutzen. Während erstere mit Wortgruppen von zwei bis drei Wörtern arbeiten, kann Deep Learning weiter gehen und mehr Kontext berücksichtigen, einen ganzen Satz oder sogar einen ganzen Absatz. Das hat seinen Preis: Wenn Sie beispielsweise ein einzelnes Wort durch das neuronale Netzwerk schicken, kann ein Deep-Learning-Tool dies in kürzester Zeit erledigen, aber für einen ganzen Textabschnitt steigt der Rechenaufwand exorbitant an, und die dafür erforderliche Hardware gibt es noch nicht so lange.
Die Grenzen der maschinellen Übersetzung
Wie auch bei anderen Anwendungen der KI verändern KI-gestützte Übersetzungstools die Art und Weise, wie Menschen ihre Arbeit verrichten, und Übersetzer befürchten, dass sie ihre Arbeitsplätze an KI-Tools verlieren könnten. Aber ihre Ergebnisse sollten mit Vorsicht genossen werden, selbst wenn sie von Deep-Learning-Übersetzungstools stammen. Maschinelle Schlussfolgerungen, insbesondere wenn sie ohne Vorgaben lernen, können durchaus falsch sein, und selbst die beste Übersetzungssoftware stößt an ihre Grenzen, sobald kulturspezifische Höflichkeit und Tonfall, Wortspiele und Ironie, Referenzen und Kontinuität oder Fachterminologie berücksichtigt werden müssen. Übersetzer werden durch die neuen Tools nicht arbeitslos, sondern kontrollieren, überprüfen und verbessern stattdessen die Ergebnisse der Tools.
Übersetzungsprofis haben mehr zu tun als nur ein bisschen Kosmetik. Ungenauigkeiten und Fehler in maschinellen Übersetzungen können, wenn sie in Beipackzetteln von Medikamenten, internationalen Verträgen, Bauanleitungen, technischen Dokumentationen und ähnlichen Texten vorkommen, sehr weitreichende Auswirkungen haben und sind daher ein absolutes No-Go. Selbst mit den besten Lernprozessen werden Übersetzungstools diesen Kompetenzvorsprung von Übersetzern so schnell nicht einholen können.