Automatische Übersetzungsmaschine von Google

Die Google Machine Translation Engine ist das Programm, das vom maschinellen Übersetzungsdienst von Google Translate verwendet wird .

In 2007 brachte die Google maschinelle Übersetzung Motor Innovationen auf den Bereich der maschinellen Übersetzung. Das Systran- System, das er bis dahin verwendet hatte, war für PCs konzipiert und unterlag deren Einschränkungen: Es handhabte Hunderttausende von Wörtern und Ausdrücken, wobei mögliche Übersetzungen durch Anwendung der darauf angewendeten Grammatikregeln eingeführt wurden.

Ein weiterer bemerkenswerter Unterschied besteht darin, dass bei der Google-Übersetzung Englisch jetzt das Herzstück des Systems ist. Mit seinen Konkurrenten, die beispielsweise Spanisch direkt ins Französische und umgekehrt übersetzen, übersetzt Google die Ausgangssprache ins Englische und übersetzt sie dann erneut vom Englischen in die Zielsprache. Es ist ein System, das Ähnlichkeiten mit dem Projekt der verteilten Sprachübersetzung aufweist , mit dem Unterschied, dass die Brückensprache keine künstliche Sprache mehr ist, die entwickelt wurde, um so wenig Mehrdeutigkeiten wie möglich darzustellen, sondern eine echte Sprache, die Ungenauigkeiten enthält.

Google, Systran und Promt

Das Google- System , das von einem Server-Center aus arbeitet, kann Milliarden von Wörtern und Ausdrücken jonglieren, "die aus einsprachigen Texten in der Zielsprache und aus Texten stammen, die parallel zu den beiden Sprachen sind". Die Grammatik wird zugunsten der engsten Äquivalenzen verzögert. Wenn Google keinen Ausdruck in seiner Datenbank findet, wird er weggelassen. Christian Boitet, Direktor von GETA (Studiengruppe für automatische Übersetzung) in Grenoble, sagte: „Jeder kann sehen, dass GoogleTranslate Übersetzungen bereitstellt, die anscheinend„ flüssig “sind, aber zu mindestens 30% unverständlich oder falsch sind, insbesondere wenn es sich um Informationen handelt sind verschwunden. ""

Die Zunahme der persönlichen Wörterbücher verlangsamt die Arbeit und die Anzahl der Wörter, die eingegeben werden können, ist manchmal nicht unbegrenzt.

Wortschatzumfang

Aufgrund der Vielfalt seines Wortschatzes hat Google bei mäßig technischen Themen einen Vorteil. Um zum Beispiel "Erbkrankheit" zu übersetzen, werden Promt und Systran das Wort in seine zwei Elemente zerlegen und "Erbkrankheit" gegenüber "genetisch bedingte Krankheit" präziser und professioneller von Google geben . Wenn wir dagegen "erbliche Belastung" vorschlagen, kennt keiner der drei "Belastung" in diesem Sinne und sie werden das Wort durch seine übliche Bedeutung der Gebühr wiedergeben: "erbliche Gebühr" für Google und "erbliche" Gebühr "für Promt und Systran, die sogar das Adjektiv ignorieren. Mit diesen beiden letzteren erhält ein Arzt, der den Ausdruck in ein Benutzerwörterbuch eingegeben hat, jetzt immer einen "Erbfehler", während er nicht befugt ist, diese Übersetzung Google aufzuerlegen .

Google kommt sogar dazu, nicht zu übersetzen, was es nicht versteht, und es nicht einmal in der Originalsprache zu belassen. Haben wir: "  Viele Juden haben jetzt ihren Lebensunterhalt damit verdient, Unterkunft und Nahrung für die Massen von Chassidim bereitzustellen, die den Admor besuchten  " und die Übersetzung lautet : "Viele Juden, die heute leben, bieten Unterkunft und Nahrung für die Massen von Chassidim, die den Admor besuchten ","  made a  "wird beiseite gelegt, als ob es nicht existiert hätte. Wir können dies überprüfen, indem wir denselben Satz einreichen, der von diesen beiden Wörtern befreit ist: Das Ergebnis ist das gleiche.

Der Fall der Fachbegriffe

Bei technischen Texten kennt der Umfang des Google zur Verfügung stehenden Wortschatzes seine Grenzen. Wenn wir auf einem in einem Artikel in deutscher Sprache lesen Arten von Spinnen der Brachypelma smithi  :

Oft heißt das, was das Weibchen den Vorderkörper auf, um das Männchen das Einhaken sein Schienbeinhaken in ihren Beißklauen zu gehört  ", sagt Google : "Oft zielt die Hündin auf den Vorderkörper, für das Männchen erlaubt das Einhaken seinen tiblauen Beiß-Haken, das heißt, sie übersetzt "Weibchen" mit "Hündin" und versucht angesichts ungewohnter Wörter nicht, sie zu analysieren, wie es Systran in beiden Fällen tut ("Oft streckt das Weibchen den Körper vorher gerade, damit das Hängen an ihren Beinhaken in ihren Krallen erscheint das Männchen beißen ") und Promt in einem (" Das Weibchen richtet oft den Vorderkörper auf, damit ihre Schienbeinhaken in ihrem Beißklauen am Männchen hängen können ").

Die Entwicklung von Google übersetzen

Es ist schwierig, in Büchern zu folgen, selbst in Artikeln, wie neu sie auch sein mögen, eine Realität, die sich ebenso verändert wie maschinelle Übersetzung. Das15. November 2014 Frédéric Kaplan schrieb:

"Bitten Sie Google Translate, dieses"  Dieses Mädchen ist hübsch  "ins Italienische zu übersetzen, und Sie erhalten einen seltsamen Vorschlag:"  Questa ragazza è abbastanza  ", buchstäblich ist dieses Mädchen"  durchschnittlich  ". Schönheit ist in der Übersetzung verloren gegangen . Wie kann einer der effizientesten automatischen Übersetzer von heute, der in der Lage ist, ein weltweit einzigartiges Sprachkapital, Milliarden von Sätzen, zu verwenden, einen solch groben Fehler machen? Die Antwort ist einfach, sie schwenkt durch Englisch. Pretty übersetzt hübsch und hübsch von abbastanza . […] Sobald dieses Prinzip verstanden ist, wird es leicht, äußerst seltsame Übersetzungssätze zu erstellen. Der idiomatische Ausdruck Es regnet Seile verwandelt sich in einen sehr poetischen Ausdruck Piove cani und gatti . Diese direkte Übersetzung von Es regnet Katzen und Hunde ist für einen Italiener absolut unverständlich. ""

Aber zu 1 st Mai 2015wird der erste Satz von Questa ragazza è bella korrekter wiedergegeben  ; Was den zweiten betrifft , so ist er auf einen einfachen Piove reduziert , offensichtlich weniger genau, aber genauer. Trotz dieser Fortschritte bleibt die Verwendung von Google Translate außerhalb einer privaten Umgebung schwierig. Die Polizei von Kopenhagen befand sich in einer peinlichen Situation, nachdem sie zugegeben hatte, einen Verdächtigen auf der Grundlage einer von Google Translate falsch übersetzten SMS befragt zu haben.

Anmerkungen und Referenzen

  1. Barbara Cassin , Forschungsdirektorin am CNRS , erklärt im Vorbeigehen von Intraduisible et mondialisation : "Das mehrsprachige Angebot sowie das bei Google allgegenwärtige Übersetzungsangebot drehen sich effektiv um eine einzige Sprache, l Englisch oder genauer gesagt Globisch . ""
  2. Häufig gestellte Fragen zu Google Translate
  3. Maschinelle Übersetzung: Funktioniert es oder nicht?
  4. Ab dem 18. März 2010 ist die Übersetzung jedoch korrekt.
  5. "  Viele Juden verdienten ihren Lebensunterhalt damit, den chassidischen Menschenmengen, die Admor besuchten, Unterkunft und Verpflegung zu bieten.  "
  6. Bis zum 13. Juli 2009 hatte sich die Übersetzung kaum verbessert.
  7. Das Weibchen häufig den Cephalothorax , damit das Männchen die Haken seiner Tibia in seiner Chelicera fixieren kann
  8. Professor für Digital Humanities an der Eidgenössischen Technischen Hochschule in Lausanne
  9. Englisch als Rückgrat oder versteckter sprachlicher Imperialismus von Google Translate
  10. Arnaud Devillard, Wenn die Polizei mit Übersetzungen von Google Sciences und Avenir vom 2. Januar 2013 gegen den Terrorismus kämpft

Siehe auch

Zum Thema passende Artikel