การแปลด้วยเครื่องประสาทเทียม (NMT) เผชิญกับความท้าทายอย่างมากในการประมวลผลงานวรรณกรรม โดยเฉพาะอย่างยิ่งในการถ่ายทอดการแสดงออกที่เต็มไปด้วยความหมายแฝงทางวัฒนธรรมและอารมณ์ เช่น คำอุปมาอุปมัยและอุปมาอุปมัยอย่างแม่นยำ ระบบ NMT แบบเดิมมักขาดความสามารถ เพื่อแก้ไขปัญหานี้ ทีมวิจัยของ Tencent ได้พัฒนาระบบการแปลใหม่ DRT-o1 ซึ่งได้รับการออกแบบมาเพื่อปรับปรุงความแม่นยำและความคล่องในการแปลงานวรรณกรรม และจับความหมายแฝงทางวัฒนธรรมและความแตกต่างทางอารมณ์ของงานได้ดียิ่งขึ้น ระบบ DRT-o1 มีสองเวอร์ชัน ได้แก่ DRT-o1-7B และ DRT-o1-14B ซึ่งสร้างขึ้นบน Qwen2.5 และแนะนำเฟรมเวิร์ก multi-agent ที่เป็นนวัตกรรมใหม่
ในขณะที่โลกาภิวัฒน์ยังคงลึกซึ้งยิ่งขึ้น เทคโนโลยีการแปลด้วยเครื่องประสาท (NMT) มีบทบาทสำคัญในการสื่อสารข้ามภาษามากขึ้น แม้ว่าเครื่องมือแปลในปัจจุบันจะทำงานได้ดีเมื่อประมวลผลเอกสารทางเทคนิคและข้อความธรรมดา แต่ยังคงเผชิญกับความท้าทายมากมายเมื่อแปลข้อความวรรณกรรม งานวรรณกรรมมักมีการแสดงออกที่เต็มไปด้วยความหมายแฝงทางวัฒนธรรมและอารมณ์ เช่น คำอุปมาอุปมัย และคำอุปมาอุปมัย และบ่อยครั้งเป็นเรื่องยากที่ระบบการแปลแบบดั้งเดิมจะถ่ายทอดความหมายที่ลึกซึ้งได้อย่างแม่นยำ
เพื่อชดเชยข้อบกพร่องนี้ ทีมวิจัยของ Tencent ได้เปิดตัวระบบการแปลใหม่ที่เรียกว่า DRT-o1 ระบบประกอบด้วยสองเวอร์ชัน: DRT-o1-7B และ DRT-o1-14B ทั้งสองโมเดลนี้สร้างขึ้นบน Qwen2.5 และแนะนำเฟรมเวิร์กหลายตัวแทนใหม่ที่ปรับให้เหมาะสมโดยเฉพาะสำหรับการแปลคำอุปมาอุปมัยและอุปมาอุปมัย ทีมวิจัยได้รวบรวมหนังสือภาษาอังกฤษที่เป็นสาธารณสมบัติประมาณ 400 เล่มจาก Project Gutenberg สกัดประโยคได้ 577,600 ประโยค และคัดแยกประโยค 63,000 ประโยคที่มีคำอุปมาอุปมัยและอุปมาอุปมัยเป็นข้อมูลการฝึกอบรม
ระบบ DRT-o1 ใช้วิธีการทำงานร่วมกันซึ่งประกอบด้วยสามบทบาท: นักแปล ที่ปรึกษา และผู้ประเมิน ขั้นตอนการทำงานของกรอบงานหลายตัวแทนนี้เริ่มต้นด้วยการระบุและการแปลคำศัพท์สำคัญในประโยคต้นฉบับทีละรายการ เพื่อให้มั่นใจถึงความถูกต้องตามบริบท หลังจากสร้างการแปลครั้งแรกแล้ว จะต้องผ่านการปรับปรุงและประเมินผลหลายรอบ ส่งผลให้การแปลราบรื่นและเข้าใจง่าย ระบบนี้สามารถจับความหมายแฝงทางวัฒนธรรมและความแตกต่างทางอารมณ์ของงานวรรณกรรมได้ดีขึ้นเมื่อทำการแปล
ผลการทดลองพบว่าคะแนน BLEU ของ DRT-o1-7B เพิ่มขึ้น 8.26 คะแนน และคะแนน COMET เพิ่มขึ้น 3.36 คะแนน ซึ่งดีกว่า Qwen2.5-7B-Instruct รุ่นก่อน DRT-o1-14B ก็ทำได้ดีเช่นกัน โดยคะแนน BLEU เพิ่มขึ้น 7.33 คะแนน และคะแนน COMET เพิ่มขึ้น 1.66 คะแนน ผลลัพธ์เหล่านี้แสดงให้เห็นว่า DRT-o1 มีประสิทธิภาพเหนือกว่ารุ่นที่มีอยู่ในการแปลวรรณกรรม โดยเฉพาะรุ่น 7B ซึ่งมีประสิทธิภาพเหนือกว่ารุ่น QwQ-32B ที่ใหญ่กว่าด้วยซ้ำ
ระบบ DRT-o1 นำความก้าวหน้าที่ก้าวล้ำมาสู่สาขาการแปลด้วยเครื่องประสาทโดยการแนะนำกรอบงานแบบหลายตัวแทนและวิธีการให้เหตุผลแบบสายโซ่ยาว ไม่เพียงแต่ปรับปรุงความแม่นยำและความคล่องในการแปลเท่านั้น แต่ยังมอบโซลูชั่นใหม่สำหรับการแปลข้อความวรรณกรรมที่ซับซ้อนอีกด้วย
ทางเข้าโครงการ: https://github.com/krystalan/DRT-o1
ไฮไลท์:
ระบบ DRT-o1 ประกอบด้วยสองเวอร์ชัน (7B และ 14B) และใช้เฟรมเวิร์กหลายตัวแทนเพื่อเพิ่มประสิทธิภาพการแปลคำอุปมาอุปมัยและอุปมาอุปมัย
ทีมวิจัยได้ดึงและคัดกรองประโยควรรณกรรม 63,000 ประโยคจากหนังสือที่เป็นสาธารณสมบัติ 400 เล่มเป็นข้อมูลการฝึกอบรม
DRT-o1 ได้ปรับปรุงคะแนน BLEU และ COMET อย่างมีนัยสำคัญ ซึ่งแสดงให้เห็นถึงความสามารถในการแปลวรรณกรรมที่แข็งแกร่ง
กล่าวโดยสรุป ระบบ DRT-o1 ได้รับผลลัพธ์ที่น่าทึ่งในด้านการแปลวรรณกรรม และกรอบงานแบบหลายตัวแทนและข้อมูลการฝึกอบรมจำนวนมากก็เป็นวิธีที่มีประสิทธิภาพในการปรับปรุงคุณภาพการแปล โอเพ่นซอร์สของโครงการนี้ยังมอบทรัพยากรที่มีคุณค่าสำหรับการวิจัยในอนาคต และคาดว่าจะส่งเสริมการพัฒนาเทคโนโลยีการแปลด้วยเครื่องประสาท และมีส่วนช่วยมากขึ้นในการสื่อสารข้ามวัฒนธรรม