神經機器翻譯(NMT)在處理文學作品時面臨著巨大的挑戰,尤其是在準確傳達隱喻和比喻等富有文化和情感內涵的表達方面。傳統的NMT系統往往力不從心。為了解決這個問題,騰訊研究團隊開發了新型翻譯系統DRT-o1,旨在提昇文學作品翻譯的準確性和流暢度,並更好地捕捉作品的文化內涵和情感細膩之處。 DRT-o1系統包含兩個版本,分別為DRT-o1-7B和DRT-o1-14B,基於Qwen2.5構建,並引入了創新的多代理框架。
隨著全球化的不斷深入,神經機器翻譯(NMT)技術在跨語言溝通中扮演越來越重要的角色。儘管目前的翻譯工具在處理技術文件和簡單文字時表現出色,但在文學文本的翻譯上依然面臨許多挑戰。文學作品中常包含隱喻和比喻等富有文化和情感內涵的表達方式,傳統的翻譯系統往往難以準確傳達其深層意義。
為了彌補這項不足,騰訊研究團隊推出了名為DRT-o1的新型翻譯系統。系統包含兩個版本:DRT-o1-7B 和DRT-o1-14B。這兩款模型基於Qwen2.5進行構建,並引入了一種全新的多代理框架,專門針對隱喻和比喻的翻譯進行最佳化。研究團隊從古登堡計畫中收集了約400本公共領域的英語書籍,提取了577,600個句子,並篩選出63,000個包含比喻和隱喻的句子,以作為訓練資料。
DRT-o1系統採用了一個由三種角色組成的協作方法:翻譯者、顧問和評估者。這個多代理框架的工作流程始於對源句中關鍵術語的識別和逐個翻譯,確保語境的準確性。產生初步翻譯後,經過多輪的改進與評估,最終形成流暢且易於理解的譯本。該系統在翻譯文學作品時,能夠更好地捕捉其文化內涵和情感細膩之處。
實驗結果顯示,DRT-o1-7B 的BLEU 得分提高了8.26分,COMET 得分提高了3.36分,優於其前身Qwen2.5-7B-Instruct。 DRT-o1-14B 同樣表現出色,BLEU 得分提升了7.33分,COMET 得分提升了1.66分。這些結果表明,DRT-o1在文學翻譯中的表現超越了現有模型,尤其是其7B 版本甚至超越了更大的QwQ-32B 模型。
DRT-o1系統透過引入多代理框架和長鏈推理方法,為神經機器翻譯領域帶來了突破性的進展。它不僅提升了翻譯的準確性和流暢度,也為複雜文學文本的翻譯提供了新的解決方案。
計畫入口:https://github.com/krystalan/DRT-o1
劃重點:
DRT-o1系統包含兩個版本(7B 和14B),採用多代理框架來優化隱喻和比喻的翻譯。
研究團隊從400本公共領域書籍中提取並篩選了63,000個文學句子作為訓練資料。
DRT-o1在BLEU 和COMET 得分上都顯著提升,展現出強大的文學翻譯能力。
總之,DRT-o1系統在文學翻譯領域取得了顯著成果,其多代理框架和大量的訓練資料為提升翻譯品質提供了有效途徑。 該計畫的開源也為未來研究提供了寶貴資源,並有望進一步推動神經機器翻譯技術的發展,為跨文化交流做出更大貢獻。