A tradução automática neural (NMT) enfrenta enormes desafios no processamento de obras literárias, especialmente na transmissão precisa de expressões ricas em conotações culturais e emocionais, como metáforas e metáforas. Os sistemas NMT tradicionais muitas vezes ficam aquém das suas capacidades. Para resolver este problema, a equipe de pesquisa da Tencent desenvolveu um novo sistema de tradução DRT-o1, que foi projetado para melhorar a precisão e a fluência da tradução de obras literárias e capturar melhor as conotações culturais e nuances emocionais das obras. O sistema DRT-o1 contém duas versões, nomeadamente DRT-o1-7B e DRT-o1-14B, que é construído em Qwen2.5 e introduz uma estrutura multiagente inovadora.
À medida que a globalização continua a se aprofundar, a tecnologia de tradução automática neural (NMT) desempenha um papel cada vez mais importante na comunicação entre idiomas. Embora as ferramentas de tradução atuais tenham um bom desempenho no processamento de documentos técnicos e textos simples, ainda enfrentam muitos desafios na tradução de textos literários. As obras literárias muitas vezes contêm expressões ricas em conotações culturais e emocionais, como metáforas e metáforas, e muitas vezes é difícil para os sistemas de tradução tradicionais transmitir com precisão os seus significados mais profundos.
Para compensar esta deficiência, a equipe de pesquisa da Tencent lançou um novo sistema de tradução chamado DRT-o1. O sistema contém duas versões: DRT-o1-7B e DRT-o1-14B. Esses dois modelos são construídos no Qwen2.5 e introduzem uma nova estrutura multiagente otimizada especificamente para a tradução de metáforas e metáforas. A equipe de pesquisa coletou cerca de 400 livros em inglês de domínio público do Projeto Gutenberg, extraiu 577.600 frases e selecionou 63.000 frases contendo metáforas e metáforas como dados de treinamento.
O sistema DRT-o1 utiliza uma abordagem colaborativa que consiste em três funções: tradutor, consultor e avaliador. O fluxo de trabalho desta estrutura multiagente começa com a identificação e tradução um por um dos termos-chave na frase de origem, garantindo a precisão contextual. Depois que uma tradução inicial é gerada, ela passa por diversas rodadas de refinamento e avaliação, resultando em uma tradução suave e fácil de entender. Este sistema pode capturar melhor a conotação cultural e as nuances emocionais das obras literárias ao traduzi-las.
Os resultados experimentais mostram que a pontuação BLEU do DRT-o1-7B aumentou 8,26 pontos e a pontuação COMET aumentou 3,36 pontos, o que é melhor do que o seu antecessor Qwen2.5-7B-Instruct. O DRT-o1-14B também teve um bom desempenho, com a pontuação BLEU aumentando em 7,33 pontos e a pontuação COMET aumentando em 1,66 pontos. Estes resultados mostram que o DRT-o1 supera os modelos existentes na tradução literária e, em particular, a sua versão 7B supera até mesmo o modelo maior QwQ-32B.
O sistema DRT-o1 traz um progresso revolucionário no campo da tradução automática neural, introduzindo uma estrutura multiagente e métodos de raciocínio de cadeia longa. Não só melhora a precisão e a fluência da tradução, mas também fornece novas soluções para a tradução de textos literários complexos.
Entrada do projeto: https://github.com/krystalan/DRT-o1
Destaque:
O sistema DRT-o1 consiste em duas versões (7B e 14B) e utiliza uma estrutura multiagente para otimizar a tradução de metáforas e metáforas.
A equipe de pesquisa extraiu e selecionou 63 mil frases literárias de 400 livros de domínio público como dados de treinamento.
O DRT-o1 melhorou significativamente as suas pontuações BLEU e COMET, demonstrando a sua forte capacidade de tradução literária.
Em suma, o sistema DRT-o1 alcançou resultados notáveis no campo da tradução literária, e a sua estrutura multiagente e grandes quantidades de dados de formação proporcionam uma forma eficaz de melhorar a qualidade da tradução. O código aberto deste projeto também fornece recursos valiosos para pesquisas futuras e espera-se que promova ainda mais o desenvolvimento da tecnologia de tradução automática neural e faça maiores contribuições para a comunicação intercultural.