신경 기계 번역(NMT)은 문학 작품을 처리할 때, 특히 은유 및 은유와 같은 문화적, 정서적 의미가 풍부한 표현을 정확하게 전달하는 데 큰 어려움에 직면합니다. 기존 NMT 시스템은 성능이 부족한 경우가 많습니다. 이 문제를 해결하기 위해 Tencent 연구팀은 문학 작품 번역의 정확성과 유창성을 향상시키고 작품의 문화적 의미와 감정적 뉘앙스를 더 잘 포착하도록 설계된 새로운 번역 시스템 DRT-o1을 개발했습니다. DRT-o1 시스템에는 Qwen2.5를 기반으로 구축되고 혁신적인 다중 에이전트 프레임워크를 도입한 DRT-o1-7B와 DRT-o1-14B라는 두 가지 버전이 포함되어 있습니다.
세계화가 계속 심화됨에 따라 신경 기계 번역(NMT) 기술은 언어 간 의사소통에서 점점 더 중요한 역할을 하고 있습니다. 현재의 번역 도구는 기술 문서와 간단한 텍스트를 처리할 때 잘 작동하지만 문학 텍스트를 번역할 때는 여전히 많은 어려움에 직면합니다. 문학 작품에는 은유, 은유 등 문화적, 정서적 의미가 풍부한 표현이 포함되어 있는 경우가 많으며, 전통적인 번역 시스템으로는 그 깊은 의미를 정확하게 전달하기 어려운 경우가 많습니다.
이러한 단점을 보완하기 위해 Tencent 연구팀은 DRT-o1이라는 새로운 번역 시스템을 출시했습니다. 시스템에는 DRT-o1-7B와 DRT-o1-14B의 두 가지 버전이 있습니다. 이 두 모델은 Qwen2.5를 기반으로 구축되었으며 은유 및 은유 번역에 특별히 최적화된 새로운 다중 에이전트 프레임워크를 도입합니다. 연구팀은 프로젝트 구텐베르그에서 퍼블릭 도메인 영어도서 약 400권을 수집해 577,600개의 문장을 추출하고, 은유와 은유가 포함된 63,000개의 문장을 훈련 데이터로 선별했다.
DRT-o1 시스템은 번역가, 컨설턴트, 평가자의 세 가지 역할로 구성된 협업 접근 방식을 사용합니다. 이 다중 에이전트 프레임워크의 워크플로는 원본 문장의 주요 용어를 식별하고 하나씩 번역하는 것으로 시작하여 상황별 정확성을 보장합니다. 초기 번역이 생성된 후 여러 차례의 개선과 평가를 거쳐 원활하고 이해하기 쉬운 번역이 탄생합니다. 이 시스템은 문학 작품을 번역할 때 문학 작품의 문화적 의미와 정서적 뉘앙스를 더 잘 포착할 수 있습니다.
실험 결과, DRT-o1-7B의 BLEU 점수는 8.26점, COMET 점수는 3.36점 증가해 전작인 Qwen2.5-7B-Instruct보다 향상된 것으로 나타났습니다. DRT-o1-14B 역시 좋은 성능을 보여 BLEU 점수가 7.33점, COMET 점수가 1.66점 상승했습니다. 이러한 결과는 DRT-o1이 문학 번역에서 기존 모델보다 성능이 뛰어나며, 특히 7B 버전이 더 큰 QwQ-32B 모델보다 성능이 뛰어나다는 것을 보여줍니다.
DRT-o1 시스템은 다중 에이전트 프레임워크와 긴 사슬 추론 방법을 도입하여 신경 기계 번역 분야에 획기적인 발전을 가져옵니다. 번역의 정확성과 유창성을 향상시킬 뿐만 아니라 복잡한 문학 텍스트 번역을 위한 새로운 솔루션을 제공합니다.
프로젝트 입구: https://github.com/krystalan/DRT-o1
가장 밝은 부분:
DRT-o1 시스템은 두 가지 버전(7B 및 14B)으로 구성되며 다중 에이전트 프레임워크를 사용하여 은유 및 은유 번역을 최적화합니다.
연구팀은 퍼블릭 도메인 도서 400권에서 63,000개의 문학 문장을 학습 데이터로 추출하고 선별했습니다.
DRT-o1은 BLEU 및 COMET 점수를 크게 향상시켜 강력한 문학 번역 능력을 입증했습니다.
즉, DRT-o1 시스템은 문학 번역 분야에서 괄목할 만한 성과를 거두었으며, 다중 에이전트 프레임워크와 대량의 훈련 데이터는 번역 품질을 향상시키는 효과적인 방법을 제공합니다. 본 프로젝트의 오픈 소스는 향후 연구를 위한 귀중한 자원도 제공하며 신경 기계 번역 기술의 발전을 더욱 촉진하고 문화 간 커뮤니케이션에 더 큰 기여를 할 것으로 기대됩니다.