Нейронный машинный перевод (НМТ) сталкивается с огромными проблемами при обработке литературных произведений, особенно при точной передаче выражений, богатых культурными и эмоциональными коннотациями, таких как метафоры и метафоры. Традиционные системы NMT часто не соответствуют своим возможностям. Чтобы решить эту проблему, исследовательская группа Tencent разработала новую систему перевода DRT-o1, которая призвана повысить точность и беглость перевода литературных произведений и лучше уловить культурный подтекст и эмоциональные нюансы произведений. Система DRT-o1 содержит две версии: DRT-o1-7B и DRT-o1-14B, которые построены на Qwen2.5 и представляют инновационную мультиагентную структуру.
Поскольку глобализация продолжает углубляться, технология нейронного машинного перевода (NMT) играет все более важную роль в межъязыковом общении. Хотя современные инструменты перевода хорошо работают при обработке технических документов и простых текстов, они по-прежнему сталкиваются со многими проблемами при переводе художественных текстов. Литературные произведения часто содержат выражения, богатые культурными и эмоциональными коннотациями, такие как метафоры и метафоры, и традиционным системам перевода часто трудно точно передать их более глубокий смысл.
Чтобы восполнить этот недостаток, исследовательская группа Tencent запустила новую систему перевода под названием DRT-o1. Система содержит две версии: ДРТ-о1-7Б и ДРТ-о1-14Б. Эти две модели построены на Qwen2.5 и представляют новую мультиагентную структуру, специально оптимизированную для перевода метафор и метафор. Исследовательская группа собрала около 400 общедоступных английских книг из проекта «Гутенберг», извлекла 577 600 предложений и отсеяла 63 000 предложений, содержащих метафоры и метафоры в качестве обучающих данных.
В системе DRT-o1 используется совместный подход, состоящий из трех ролей: переводчика, консультанта и оценщика. Рабочий процесс этой многоагентной структуры начинается с идентификации и поочередного перевода ключевых терминов в исходном предложении, обеспечивая контекстуальную точность. После создания первоначального перевода он проходит несколько этапов уточнения и оценки, в результате чего получается гладкий и простой для понимания перевод. Эта система может лучше уловить культурный смысл и эмоциональные нюансы литературных произведений при их переводе.
Результаты экспериментов показывают, что показатель BLEU DRT-o1-7B увеличился на 8,26 балла, а показатель COMET увеличился на 3,36 балла, что лучше, чем у его предшественника Qwen2.5-7B-Instruct. DRT-o1-14B также показал хорошие результаты: оценка BLEU увеличилась на 7,33 балла, а оценка COMET увеличилась на 1,66 балла. Эти результаты показывают, что DRT-o1 превосходит существующие модели в художественном переводе, особенно его версию 7B, которая превосходит даже более крупную модель QwQ-32B.
Система DRT-o1 приносит прорыв в области нейронного машинного перевода, представляя многоагентную структуру и методы рассуждения с длинной цепочкой. Он не только повышает точность и беглость перевода, но и предоставляет новые решения для перевода сложных художественных текстов.
Вход в проект: https://github.com/krystalan/DRT-o1
Выделять:
Система DRT-o1 состоит из двух версий (7B и 14B) и использует мультиагентную структуру для оптимизации перевода метафор и метафор.
Исследовательская группа извлекла и проверила 63 000 литературных предложений из 400 книг, являющихся общественным достоянием, в качестве обучающих данных.
DRT-o1 значительно улучшил свои показатели BLEU и COMET, продемонстрировав свои сильные способности к литературному переводу.
Короче говоря, система DRT-o1 добилась замечательных результатов в области художественного перевода, а ее мультиагентная структура и большие объемы обучающих данных обеспечивают эффективный способ повышения качества перевода. Открытый исходный код этого проекта также предоставляет ценные ресурсы для будущих исследований и, как ожидается, будет способствовать дальнейшему развитию технологии нейронного машинного перевода и внесет больший вклад в межкультурное общение.