ซีรีส์ล่าสุดของโมเดลการแปลคำพูด Seamless Communication ที่ออกโดย Meta ถือได้ว่าเป็นความก้าวหน้าครั้งสำคัญในด้านการแปลคำพูด ซีรีส์นี้ประกอบด้วยโมเดลสี่รุ่นที่รองรับการแปลคำพูดแบบเรียลไทม์ในเกือบร้อยภาษา โดยมีความล่าช้าเพียงประมาณ 2 วินาที และสามารถคืนโทนเสียง ความเร็ว และรายละเอียดอื่นๆ ของคำพูดต้นฉบับได้อย่างมาก ทำให้เอฟเฟกต์การแปลสมจริงและเป็นธรรมชาติ . การเคลื่อนไหวของ Meta ไม่เพียงแต่แสดงให้เห็นถึงตำแหน่งผู้นำในด้านปัญญาประดิษฐ์เท่านั้น แต่ยังนำความสะดวกสบายอย่างที่ไม่เคยมีมาก่อนมาสู่การสื่อสารทั่วโลก
เมื่อเร็วๆ นี้ Meta ได้เปิดตัวโมเดลการแปลคำพูดใหม่ ซีรีส์ Seamless Communication ซึ่งประกอบด้วย 4 โมเดล และรองรับการแปลคำพูดแบบเรียลไทม์ระหว่างเกือบ 100 ภาษา โดยมีการควบคุมการหน่วงเวลาประมาณ 2 วินาที โมเดลสามารถสร้างคุณสมบัติที่ซับซ้อน เช่น การหยุดชั่วคราว น้ำเสียง และความเร็วในการพูดของคำพูดต้นฉบับ ทำให้การแปลสมจริงยิ่งขึ้น สถาปัตยกรรมแบบไม่ถอยอัตโนมัติถูกนำมาใช้เพื่อรองรับการแปลแบบลำดับยาว นอกจากนี้ Meta ยังได้โอเพ่นซอร์สโมเดลและคลังคำพูดที่ใหญ่ที่สุดถึง 585,000 ชั่วโมง และเพิ่มฟังก์ชันต่างๆ เช่น ลายน้ำเสียง และการลดความเป็นพิษต่อการแปล เพื่อป้องกันการละเมิดโมเดล
โมเดลโอเพ่นซอร์สและคลังข้อมูลขนาดใหญ่ของ Meta จะส่งเสริมการพัฒนาเทคโนโลยีการแปลคำพูดอย่างมาก และส่งเสริมการแลกเปลี่ยนข้อมูลทั่วโลก ในเวลาเดียวกัน มาตรการต่อต้านการละเมิดยังสะท้อนถึงความรับผิดชอบในการประยุกต์ใช้เทคโนโลยี เราตั้งตารอซีรีส์ Seamless Communication ที่จะนำมาซึ่งความประหลาดใจอีกมากมายในอนาคต