Die neuronale maschinelle Übersetzung (NMT) steht bei der Verarbeitung literarischer Werke vor großen Herausforderungen, insbesondere bei der präzisen Vermittlung von Ausdrücken, die reich an kulturellen und emotionalen Konnotationen sind, wie etwa Metaphern und Metaphern. Herkömmliche NMT-Systeme bleiben oft hinter ihren Möglichkeiten zurück. Um dieses Problem zu lösen, entwickelte das Forschungsteam von Tencent ein neues Übersetzungssystem DRT-o1, das die Genauigkeit und Flüssigkeit der Übersetzung literarischer Werke verbessern und die kulturellen Konnotationen und emotionalen Nuancen der Werke besser erfassen soll. Das DRT-o1-System enthält zwei Versionen, nämlich DRT-o1-7B und DRT-o1-14B, die auf Qwen2.5 basieren und ein innovatives Multi-Agenten-Framework einführen.
Da die Globalisierung immer weiter voranschreitet, spielt die Technologie der neuronalen maschinellen Übersetzung (NMT) eine immer wichtigere Rolle in der sprachübergreifenden Kommunikation. Obwohl aktuelle Übersetzungstools bei der Verarbeitung technischer Dokumente und einfacher Texte eine gute Leistung erbringen, stehen sie bei der Übersetzung literarischer Texte immer noch vor vielen Herausforderungen. Literarische Werke enthalten oft Ausdrücke, die reich an kulturellen und emotionalen Konnotationen sind, wie Metaphern und Metaphern, und es ist für traditionelle Übersetzungssysteme oft schwierig, ihre tieferen Bedeutungen genau zu vermitteln.
Um diesen Mangel auszugleichen, hat das Forschungsteam von Tencent ein neues Übersetzungssystem namens DRT-o1 auf den Markt gebracht. Das System enthält zwei Versionen: DRT-o1-7B und DRT-o1-14B. Diese beiden Modelle basieren auf Qwen2.5 und führen ein neues Multi-Agenten-Framework ein, das speziell für die Übersetzung von Metaphern und Metaphern optimiert ist. Das Forschungsteam sammelte etwa 400 gemeinfreie englische Bücher aus dem Projekt Gutenberg, extrahierte 577.600 Sätze und filterte 63.000 Sätze heraus, die Metaphern und Metaphern enthielten, als Trainingsdaten.
Das DRT-o1-System verwendet einen kollaborativen Ansatz, der aus drei Rollen besteht: Übersetzer, Berater und Bewerter. Der Arbeitsablauf dieses Multiagenten-Frameworks beginnt mit der Identifizierung und Einzelübersetzung von Schlüsselbegriffen im Quellsatz, um kontextbezogene Genauigkeit sicherzustellen. Nachdem eine erste Übersetzung erstellt wurde, durchläuft sie mehrere Verfeinerungs- und Bewertungsrunden, was zu einer reibungslosen und leicht verständlichen Übersetzung führt. Dieses System kann die kulturelle Konnotation und emotionalen Nuancen literarischer Werke bei der Übersetzung besser erfassen.
Experimentelle Ergebnisse zeigen, dass der BLEU-Score von DRT-o1-7B um 8,26 Punkte und der COMET-Score um 3,36 Punkte gestiegen ist, was besser ist als beim Vorgänger Qwen2.5-7B-Instruct. Auch DRT-o1-14B schnitt gut ab: Der BLEU-Score stieg um 7,33 Punkte und der COMET-Score um 1,66 Punkte. Diese Ergebnisse zeigen, dass DRT-o1 bestehende Modelle in der Literaturübersetzung übertrifft und insbesondere seine 7B-Version sogar das größere QwQ-32B-Modell übertrifft.
Das DRT-o1-System bringt bahnbrechende Fortschritte auf dem Gebiet der neuronalen maschinellen Übersetzung, indem es ein Multi-Agenten-Framework und langkettige Argumentationsmethoden einführt. Es verbessert nicht nur die Genauigkeit und Fließfähigkeit der Übersetzung, sondern bietet auch neue Lösungen für die Übersetzung komplexer literarischer Texte.
Projekteingang: https://github.com/krystalan/DRT-o1
Highlight:
Das DRT-o1-System besteht aus zwei Versionen (7B und 14B) und nutzt ein Multi-Agenten-Framework, um die Übersetzung von Metaphern und Metaphern zu optimieren.
Das Forschungsteam extrahierte und überprüfte 63.000 literarische Sätze aus 400 gemeinfreien Büchern als Trainingsdaten.
DRT-o1 hat seine BLEU- und COMET-Ergebnisse erheblich verbessert und damit seine starken literarischen Übersetzungsfähigkeiten unter Beweis gestellt.
Kurz gesagt, das DRT-o1-System hat im Bereich der Literaturübersetzung bemerkenswerte Ergebnisse erzielt und sein Multi-Agenten-Framework und große Mengen an Trainingsdaten bieten eine effektive Möglichkeit, die Übersetzungsqualität zu verbessern. Die Open Source dieses Projekts stellt auch wertvolle Ressourcen für zukünftige Forschungen bereit und soll die Entwicklung neuronaler maschineller Übersetzungstechnologie weiter vorantreiben und einen größeren Beitrag zur interkulturellen Kommunikation leisten.