تواجه الترجمة الآلية العصبية (NMT) تحديات كبيرة عند معالجة الأعمال الأدبية، خاصة في نقل التعابير الدقيقة الغنية بالدلالات الثقافية والعاطفية مثل الاستعارات والاستعارات. غالبًا ما تكون أنظمة NMT التقليدية أقل من قدراتها. ومن أجل حل هذه المشكلة، قام فريق البحث في Tencent بتطوير نظام ترجمة جديد DRT-o1، والذي تم تصميمه لتحسين دقة وطلاقة ترجمة الأعمال الأدبية والتقاط الدلالات الثقافية والفروق الدقيقة العاطفية للأعمال بشكل أفضل. يحتوي نظام DRT-o1 على نسختين، DRT-o1-7B وDRT-o1-14B، المبنيتين على Qwen2.5 ويقدمان إطار عمل مبتكر متعدد الوكلاء.
مع استمرار العولمة في التعمق، تلعب تكنولوجيا الترجمة الآلية العصبية (NMT) دورًا متزايد الأهمية في التواصل بين اللغات. على الرغم من أن أدوات الترجمة الحالية تؤدي أداءً جيدًا عند معالجة المستندات الفنية والنصوص البسيطة، إلا أنها لا تزال تواجه العديد من التحديات عند ترجمة النصوص الأدبية. غالبًا ما تحتوي الأعمال الأدبية على تعبيرات غنية بالدلالات الثقافية والعاطفية مثل الاستعارات والاستعارات، وغالبًا ما يصعب على أنظمة الترجمة التقليدية نقل معانيها العميقة بدقة.
ومن أجل تعويض هذا النقص، أطلق فريق البحث في Tencent نظام ترجمة جديدًا يسمى DRT-o1. يحتوي النظام على نسختين: DRT-o1-7B وDRT-o1-14B. تم بناء هذين النموذجين على Qwen2.5 ويقدمان إطارًا جديدًا متعدد الوكلاء مُحسّنًا خصيصًا لترجمة الاستعارات والاستعارات. قام فريق البحث بجمع حوالي 400 كتاب باللغة الإنجليزية من مشروع جوتنبرج، واستخرج 577600 جملة، وقام بفحص 63000 جملة تحتوي على استعارات واستعارات كبيانات تدريب.
يستخدم نظام DRT-o1 نهجًا تعاونيًا يتكون من ثلاثة أدوار: المترجم والمستشار والمقيم. يبدأ سير العمل في إطار العمل متعدد الوكلاء هذا بتحديد المصطلحات الأساسية في الجملة المصدر وترجمتها واحدًا تلو الآخر، مما يضمن دقة السياق. بعد إنشاء الترجمة الأولية، تمر عبر جولات متعددة من التحسين والتقييم، مما يؤدي إلى ترجمة سلسة وسهلة الفهم. يمكن لهذا النظام التقاط الدلالة الثقافية والفروق الدقيقة العاطفية للأعمال الأدبية بشكل أفضل عند ترجمتها.
تظهر النتائج التجريبية أن درجة BLEU لـ DRT-o1-7B زادت بمقدار 8.26 نقطة، وزادت درجة COMET بمقدار 3.36 نقطة، وهو أفضل من سابقتها Qwen2.5-7B-Instruct. كان أداء DRT-o1-14B جيدًا أيضًا، حيث زادت درجة BLEU بمقدار 7.33 نقطة وزادت درجة COMET بمقدار 1.66 نقطة. تظهر هذه النتائج أن DRT-o1 يتفوق على النماذج الموجودة في الترجمة الأدبية، وخاصة إصداره 7B، الذي يتفوق حتى على النموذج الأكبر QwQ-32B.
يحقق نظام DRT-o1 تقدمًا كبيرًا في مجال الترجمة الآلية العصبية من خلال تقديم إطار عمل متعدد الوكلاء وطرق تفكير طويلة السلسلة. فهو لا يعمل على تحسين دقة الترجمة وطلاقتها فحسب، بل يوفر أيضًا حلولاً جديدة لترجمة النصوص الأدبية المعقدة.
مدخل المشروع: https://github.com/krystalan/DRT-o1
تسليط الضوء على:
يتكون نظام DRT-o1 من نسختين (7B و14B) ويستخدم إطار عمل متعدد الوكلاء لتحسين ترجمة الاستعارات والاستعارات.
قام فريق البحث باستخراج وفحص 63000 جملة أدبية من 400 كتاب من كتب الملكية العامة كبيانات تدريبية.
لقد قام DRT-o1 بتحسين درجات BLEU وCOMET بشكل كبير، مما يدل على قدراته القوية في الترجمة الأدبية.
باختصار، حقق نظام DRT-o1 نتائج ملحوظة في مجال الترجمة الأدبية، ويوفر إطاره متعدد الوكلاء وكميات كبيرة من بيانات التدريب طريقة فعالة لتحسين جودة الترجمة. يوفر المصدر المفتوح لهذا المشروع أيضًا موارد قيمة للأبحاث المستقبلية ومن المتوقع أن يزيد من تعزيز تطوير تكنولوجيا الترجمة الآلية العصبية ويقدم مساهمات أكبر في التواصل بين الثقافات.