Die automatische Übersetzung bezieht sich auf die brutale Übersetzung eines Textes, der vollständig von einem oder mehreren Computerprogrammen erstellt wurde . Bei der Übersetzung eines Audio-Gesprächs, live oder aufgezeichnet, spricht man von automatischer Transkription . Ein menschlicher Übersetzer greift nicht während der Übersetzung ein, um Textfehler zu korrigieren, sondern nur vorher und/oder nachher. Es unterscheidet sich von der computergestützten Übersetzung, bei der die Übersetzung teilweise manuell, möglicherweise interaktiv mit der Maschine, erfolgt.
Trotz seiner Schwächen kann es Dienstleistungen in Bereichen wie International Watch (einschließlich Technologie Watch ) erbringen , wo es eine oberflächliche, aber schnelle Kenntnis großer Textmengen ermöglicht.
Seit der Jahrhundertwende hat die maschinelle Übersetzung im Web ein beträchtliches Wachstum erfahren , wobei mehrere Online-Systeme in der Lage sind, immer längere Webseiten oder Texte in Sekundenschnelle automatisch zu übersetzen. Es wird von der Öffentlichkeit sehr geschätzt, da es es ermöglicht, das Thema einer Webseite in einer völlig unbekannten Sprache und die darin enthaltenen wichtigsten Fakten oder Informationen grob zu entschlüsseln. Um die Navigation zu vereinfachen, werden mehrere Suchmaschinen wie Google , Altavista oder Yahoo! erlauben, dass es systematisch verwendet wird.
Ende Oktober 2005, kündigt die Presse bemerkenswerte Verbesserungen an. Das International Center for Advanced Communications Technologies, das gemeinsam von der Carnegie-Mellon University in Pittsburgh und der Universität Karlsruhe in Deutschland betrieben wird, stellt ein Computersystem zur sofortigen Übersetzung vor. Ein chinesischer Student, ausgestattet mit elf Elektroden an Gesicht und Hals, hält eine Rede in seiner eigenen Sprache, die simultan ins Englische und Spanische übersetzt wird. Die Forscher kommen zu dem Schluss, dass „die Ergebnisse nicht perfekt sind“ und dass „manchmal Schwierigkeiten auftreten können“. Tatsächlich weist kein Artikel darauf hin, dass deutsche und amerikanische Journalisten mit dem Studenten diskutieren konnten. Die Journalisten unterlassen es in der Regel, anzugeben, dass, wenn Doktor Waibel ankündigt, dass er Fragen deutscher und amerikanischer Journalisten entgegennimmt, der Computer so etwas hört wie: "Also wir Glykogen, abwechselnde Fragen zwischen Deutschland und Amerika. Bei dieser Art der Sofortübersetzung fehlen noch Softwareverbesserungen in Bezug auf die Spracherkennung , insbesondere durch Umgebungsgeräusche und schlechte Aussprache.
Im Jahr 2018 gelang es einem auf künstlicher Intelligenz basierenden Computertool, in zwölf Stunden ein Buch mit 800 Seiten Text , Grafiken und mathematischen Formeln , geschrieben mit LaTeX, zu übersetzen . Dieses Tool, das von Quantmetry, einem jungen Beratungsunternehmen für künstliche Intelligenz für Unternehmen, das mit vier französischen Forschern, die sich auf Deep Learning spezialisiert haben , von ENSAI , INRIA und der Universität Caen zusammenarbeitet , entwickelt wurde, basiert auf dem maschinellen Übersetzungsdienst DeepL .
Die Methode des Deep Learning und des Fortschritts der maschinellen Übersetzung, inspiriert von der Funktionsweise des menschlichen Gehirns, basiert auf der neuronalen maschinellen Übersetzung, die im Englischen im Allgemeinen als NMT " Neural Machine Translation " bezeichnet wird.
Im Jahr 2019 ist DeepL von Linguee einer der führenden Dienste in der Domain, aber dieser Dienst könnte durch weitere Fortschritte von Google überholt werden.
Im Jahr 2010 war Pangeanic das weltweit erste Unternehmen, das den statistischen Übersetzer Moses in einem kommerziellen Umfeld anwendete, indem es in Zusammenarbeit mit dem Instituto Técnico de Informática de Valencia (ITI) und der Forschung eine Plattform für Selbstlernen, Korpusreinigung und Recycling entwickelte Gruppe Anerkennung von Formen und Technologie der menschlichen Sprache der Politècnica de València. Als Gründungsmitglied von TAUS gewann Pangeanic mit seinem IADAATPA- Projekt 2017 den größten Infrastrukturauftrag für die maschinelle Übersetzung für die Europäische Kommission . Seit 2019 leitet Pangeanic NTEU.eu , ein CEF-Projekt der Europäischen Kommission. NTEU ist die größte auf neuronalen Netzwerken basierende Maschinenfarm für maschinelle Übersetzungen für europäische öffentliche Verwaltungen.
Seit 2020 bietet Google die automatische Übersetzung von Sprache oder mündlichen Gesprächen über Mobiltelefone an.
Maschinelle Übersetzung unterscheidet sich von maschineller Transkription dadurch, dass maschinelle Übersetzung eine Übersetzung ist – von schriftlich zu schriftlich – während die Transkription auf Sprache angewendet wird und in schriftlicher Form angeboten werden kann.
Das Übersetzungszentrum für die Einrichtungen der EU beispielsweise bietet seinen Nutzern beide Arten von Dienstleistungen an, um schnell und kostengünstig einen Text zu erhalten, der ohne genaue Korrektheit verwendet werden kann.
Der erste indische Filmverleih – ursprünglich von VHS – mit mehreren hundert Millionen registrierten Nutzern, bekannt für seine Blockbuster-Filme, hat alle 12.000 Produkte in seinem Katalog vom Google-Dienst untertiteln – automatisch transkribieren – lassen, um sie in arabischer Sprache zur Verfügung zu stellen. Diese automatische Transkription reduziert die Kosten um 25 % und die Verzögerungen um zwei Tage. Es führt auch zu Fehlern, die korrigiert werden müssen, wenn sie erkannt oder identifiziert werden.
Der Übersetzungsprozess (im menschlichen Sinne) lässt sich in drei aufeinanderfolgende Phasen einteilen:
In rechnerischer Hinsicht wird Verstehen zu Analyse , Deverbalisierung zu Übertragung und Reexpression zu Generation . Diese Phasen des Prozesses werden im Vauquois-Dreieck modelliert. Dieses Modell ist nützlich, da es mehrere mögliche Pfade gibt, die die verschiedenen bisher betrachteten Ansätze darstellen, um von der Quelle zum Ziel zu gelangen. Je höher der Grad der Konzeptualisierung, desto kürzer der Übertragungsweg. Es gibt vier Hauptmöglichkeiten:
Derzeit basieren Übersetzungsmaschinen hauptsächlich auf Regeln oder Statistiken. Es entsteht ein sogenannter Hybridpfad. Systran , Google Translate , Reverso und Microsoft Translation verwenden hybride Ansätze.
Die Voraussetzungen hängen vom angestrebten Ansatz ab: regelbasierte Übersetzung (Wort-für-Wort, Übertragung, Pivot), Beispielübersetzung, statistische Übersetzung.
Regelbasierte maschinelle Übersetzung erfordert:
Beispielübersetzung und statistische Übersetzung erfordern:
Darüber hinaus benötigen wir möglicherweise linguistische Analysetools wie:
Für die maschinelle Übersetzung kommen mehrere Ansätze in Betracht.
Die Verwendung der maschinellen Übersetzung ist für bestimmte Börsen und in bestimmten Berufskreisen üblich geworden.
Beispielsweise könnten Krankenhäuser und Kliniken in den Vereinigten Staaten trotz der Risiken und in Ermangelung kompetenter Fachleute auf maschinelle Übersetzung zurückgreifen.
90 % der von der Generaldirektion Übersetzung (GD TRAD) übersetzten Texte werden durch maschinelle Übersetzung vorübersetzt.
Die maschinelle Übersetzung, grob, ist nicht perfekt, und einige Fehler können im Ergebnis gefunden werden, z. B. wenn ein Wort anstelle eines anderen verwendet wird. Es muss daher überarbeitet werden, um Fehler zu beseitigen.
Beispiel für einen Fehler, bei dem das Wort Urteil mit dem Wort Dekret übersetzt wird:
" Bezugnehmend auf das in diesem Fall erlassene Dekret vom 31. Januar 2019, mit dem am 1. Juli 2013 que la feierliche Hochzeit erlassen wurde. ( " Unter Bezugnahme auf das Dekret in diesem Fall vom 31. Januar 2019, mit dem verfügt wurde, dass die Heirat würde am 1. Juli 2013 feierlich gefeiert " auf Englisch )"
- Juristische Übersetzung versus maschinelle Übersetzung
Wenn Quantität und Kosten Vorrang vor Qualität haben, wird die maschinelle Übersetzung bevorzugt und der professionelle Übersetzer muss seinen Mehrwert rechtfertigen.
Qualitätsmessmetriken werden verwendet, um die Messung der Qualität der maschinellen Übersetzung automatisieren zu können. Einige bekannte Metriken sind BLUE , RED, NIST und METEOR.
Die maschinelle Übersetzung kann auch der menschlichen Klassifizierung unterliegen:
Diese Art von Service kann Risiken im Bereich der Privatsphäre sowie die Gefahr rassistischer oder sexistischer Vorurteile bergen.
Missbrauch kann je nach Verwendung zu anderen Risiken führen, so wurde laut Daily Telegraph ein polnischer Mitarbeiter schwer verletzt, nachdem er die Sicherheitshinweise befolgt hatte, die Google auf Wunsch des Arbeitgebers - Parker's Nurseries - falsch oder falsch übersetzt hatte.
Das Wissen, maschinelle Übersetzung mit dem nötigen Rückblick einzusetzen, wird als „Machine Translation Literacy“ bezeichnet.
Aktuelle Übersetzungsgeräte sind für begrenzte Situationen nützlich, z. B. für die Buchung eines Zimmers in einem Hotel. "Wenn ich nach Peking gehe, kann ich problemlos im Hilton übernachten", sagt Stephan Vogel, Forscher bei Carnegie Mellon.
Online-Dienste sind vom Aussehen her einfach zu bedienen: Sie bestehen darin, den Dienst zu öffnen, den zu übersetzenden Text automatisch zu kopieren, die Originalsprache und die Zielsprache auszuwählen und dann die Übersetzung anzufordern.
Kostenlose Online-Übersetzer :
Sie ermöglichen es Ihnen, Wörter oder Texte von begrenzter Größe zu übersetzen. Dies ist zum Beispiel:
Kostenlose Software :
Entwicklungsumgebungen :
Verschiedene Projekte zielen darauf ab, die Leistung und Geschwindigkeit von Übersetzungsmaschinen (einschließlich der von Google ) zu verbessern , in der Hoffnung, eines Tages die "Sprachbarriere" überwinden und in Echtzeit übersetzen zu können (wie es sich viele Science-Fiction- Autoren vorstellen ) a Fremdsprache, oder sogar mit bestimmten Tieren über Sprachverarbeitungssoftware "kommunizieren" zu können.