La traducción automática neuronal (NMT) enfrenta enormes desafíos al procesar obras literarias, especialmente a la hora de transmitir con precisión expresiones ricas en connotaciones culturales y emocionales, como metáforas y metáforas. Los sistemas tradicionales de NMT a menudo no alcanzan sus capacidades. Para resolver este problema, el equipo de investigación de Tencent desarrolló un nuevo sistema de traducción DRT-o1, que está diseñado para mejorar la precisión y fluidez de la traducción de obras literarias y capturar mejor las connotaciones culturales y los matices emocionales de las obras. El sistema DRT-o1 contiene dos versiones, a saber, DRT-o1-7B y DRT-o1-14B, que se basa en Qwen2.5 e introduce un marco innovador de múltiples agentes.
A medida que la globalización continúa profundizándose, la tecnología de traducción automática neuronal (NMT) desempeña un papel cada vez más importante en la comunicación entre idiomas. Aunque las herramientas de traducción actuales funcionan bien al procesar documentos técnicos y textos simples, todavía enfrentan muchos desafíos al traducir textos literarios. Las obras literarias suelen contener expresiones ricas en connotaciones culturales y emocionales, como metáforas y metáforas, y a menudo resulta difícil para los sistemas de traducción tradicionales transmitir con precisión sus significados más profundos.
Para compensar esta deficiencia, el equipo de investigación de Tencent lanzó un nuevo sistema de traducción llamado DRT-o1. El sistema contiene dos versiones: DRT-o1-7B y DRT-o1-14B. Estos dos modelos se basan en Qwen2.5 e introducen un nuevo marco multiagente optimizado específicamente para la traducción de metáforas y metáforas. El equipo de investigación recopiló alrededor de 400 libros en inglés de dominio público del Proyecto Gutenberg, extrajo 577.600 oraciones y examinó 63.000 oraciones que contenían metáforas y metáforas como datos de entrenamiento.
El sistema DRT-o1 utiliza un enfoque colaborativo que consta de tres roles: traductor, consultor y evaluador. El flujo de trabajo de este marco de múltiples agentes comienza con la identificación y traducción uno por uno de los términos clave en la oración fuente, lo que garantiza la precisión contextual. Después de generar una traducción inicial, pasa por múltiples rondas de refinamiento y evaluación, lo que da como resultado una traducción fluida y fácil de entender. Este sistema puede captar mejor la connotación cultural y los matices emocionales de las obras literarias al traducirlas.
Los resultados experimentales muestran que la puntuación BLEU de DRT-o1-7B ha aumentado en 8,26 puntos y la puntuación COMET ha aumentado en 3,36 puntos, que es mejor que su predecesor Qwen2.5-7B-Instruct. DRT-o1-14B también tuvo un buen desempeño: la puntuación BLEU aumentó en 7,33 puntos y la puntuación COMET aumentó en 1,66 puntos. Estos resultados muestran que DRT-o1 supera a los modelos existentes en traducción literaria y, en particular, su versión 7B supera incluso al modelo más grande QwQ-32B.
El sistema DRT-o1 aporta un gran avance al campo de la traducción automática neuronal al introducir un marco de múltiples agentes y métodos de razonamiento de cadena larga. No sólo mejora la precisión y fluidez de la traducción, sino que también proporciona nuevas soluciones para la traducción de textos literarios complejos.
Entrada del proyecto: https://github.com/krystalan/DRT-o1
Destacar:
El sistema DRT-o1 consta de dos versiones (7B y 14B) y utiliza un marco de múltiples agentes para optimizar la traducción de metáforas y metáforas.
El equipo de investigación extrajo y analizó 63.000 frases literarias de 400 libros de dominio público como datos de entrenamiento.
DRT-o1 ha mejorado significativamente sus puntuaciones BLEU y COMET, lo que demuestra sus sólidas capacidades de traducción literaria.
En resumen, el sistema DRT-o1 ha logrado resultados notables en el campo de la traducción literaria, y su marco multiagente y una gran cantidad de datos de capacitación proporcionan una forma eficaz de mejorar la calidad de la traducción. El código abierto de este proyecto también proporciona recursos valiosos para futuras investigaciones y se espera que promueva aún más el desarrollo de la tecnología de traducción automática neuronal y haga mayores contribuciones a la comunicación intercultural.