Doubao App เปิดตัวรุ่นใหญ่แบบเสียง "จากต้นทางถึงปลายทาง" ล่าสุดเมื่อวันที่ 20 มกราคม 2568 ซึ่งถือเป็นการอัปเดตครั้งใหญ่ในฟังก์ชันการโทรด้วยเสียงแบบเรียลไทม์ การอัปเดตนี้แสดงให้เห็นว่า Doubao มีความก้าวหน้าอย่างมากในด้านการโต้ตอบด้วยเสียง โดยไม่ได้อาศัยโซลูชันแบบเรียงซ้อน ASR, LLM และ TTS แบบดั้งเดิมอีกต่อไป แต่รวมการรู้จำเสียง ความเข้าใจ และการสร้างไว้ในโมเดลเดียวกัน ทำให้ได้รับความราบรื่นมากขึ้น ประสบการณ์การโต้ตอบด้วยเสียงอัจฉริยะ จุดเน้นของการอัปเดตนี้คือการปรับปรุงความเป็นมานุษยวิทยาของการโต้ตอบด้วยเสียง ช่วยให้ AI เข้าใจและตอบสนองต่ออารมณ์ของมนุษย์ได้ดีขึ้น
เมื่อวันที่ 20 มกราคม 2568 Doubao App ได้เปิดตัวรูปแบบเสียง "จากต้นทางถึงปลายทาง" ล่าสุดอย่างเป็นทางการ และได้ทำการอัปเดตที่สำคัญกับฟังก์ชันการโทรด้วยเสียงแบบเรียลไทม์ ความก้าวหน้านี้ถือเป็นก้าวกระโดดอีกขั้นของ Doubao ในด้านปฏิสัมพันธ์ด้วยเสียง ซึ่งเหนือกว่าโซลูชันแบบเรียงซ้อนก่อนหน้านี้ของ ASR (การรู้จำเสียงอัตโนมัติ), LLM (โมเดลภาษาขนาดใหญ่) และ TTS (Tensheng Audio) ซึ่งบูรณาการการรู้จำเสียง ความเข้าใจ และการสร้างแบบบูรณาการ ในรูปแบบเดียวกัน
หลังจากการทดสอบโดย "Smart Emergence" จุดเด่นที่สุดของ Doubao เวอร์ชันใหม่ก็คือ มีความสามารถในการแสดงออกและอารมณ์ความรู้สึกได้เหมือนมนุษย์ ซึ่งช่วยปรับปรุงระดับความคล่องแคล่วและความฉลาดของบทสนทนา โดยเฉพาะอย่างยิ่ง โหมด "Soul Singer" และ "Various Master" ช่วยให้ Doubao ไม่เพียงแต่ร้องเพลงเท่านั้น แต่ยังแสดงบทบาทสมมติที่หลากหลาย กลายเป็นโหมดใหม่ยอดนิยมสำหรับการโต้ตอบกับผู้ใช้ ตัวอย่างเช่น เมื่อผู้ใช้ขอให้ Doubao เลียนแบบเสียงของคนดัง Yu Shuxin Doubao ไม่เพียงแต่จำลองน้ำเสียงของตัวละครได้สำเร็จ แต่ยังแสดงบุคลิกที่เป็นเอกลักษณ์ของตัวเองอย่างสนุกสนานอีกด้วย
สิ่งที่น่าพูดถึงยิ่งกว่านั้นก็คือ Doubao สามารถแต่งเพลงด้นสดด้วยบทสนทนาที่เป็นธรรมชาติโดยไม่จำเป็นต้องใช้คำแนะนำที่ซับซ้อนหรือคำแนะนำจากมืออาชีพ ผู้ใช้สามารถขอให้ Doubao ร้องเพลงได้ตามต้องการ และยังสามารถระบุธีมของเนื้อเพลงได้อีกด้วย แม้ว่าการแสดงของ Doubao จะทำผิดพลาดเล็กๆ น้อยๆ เป็นครั้งคราว แต่ความเร็วในการตอบสนองและความสามารถในการแสดงด้นสดของเขานั้นน่าทึ่งมาก ซึ่งแสดงให้เห็นถึงความสามารถด้านมานุษยวิทยาที่แข็งแกร่งของเขา
นอกจากนี้ โหมดบุคลิกภาพที่เพิ่มเข้ามาใหม่ของ Doubao สองโหมด ได้แก่ "กระเป๋าใบเล็ก" และ "เจ้านายที่พูดเกินจริง" ยังนำความสดชื่นมาสู่ผู้ใช้อีกด้วย รูปแบบบุคลิกภาพเหล่านี้ช่วยให้ Doubao สามารถแสดงอารมณ์และสไตล์ที่แตกต่างกันในสถานการณ์ที่แตกต่างกัน จึงช่วยเพิ่มความสนุกสนานและความสมจริงของการโต้ตอบ
ปัจจุบัน ด้วยการพัฒนาเทคโนโลยีการโต้ตอบด้วยเสียงที่เพิ่มมากขึ้น การอัพเดต Doubao นี้ไม่เพียงแต่ขยายสถานการณ์การใช้งาน AI ไปสู่มิตรภาพทางอารมณ์ การให้คำปรึกษาทางจิตวิทยา และสาขาอื่น ๆ แต่ยังทำให้ความสามารถในการสื่อสารทางอารมณ์ของ AI ใกล้ชิดกับมนุษย์มากขึ้นอีกด้วย การเปลี่ยนแปลงนี้จะทำให้ Doubao สามารถครองตำแหน่งในตลาดที่มีการแข่งขันสูง และเป็นผู้นำในการพัฒนาปฏิสัมพันธ์ของ AI ในอนาคตได้อย่างไม่ต้องสงสัย
การอัปเดตแอป Doubao นี้ไม่เพียงแต่ประสบความสำเร็จในการพัฒนาเทคโนโลยีเท่านั้น แต่ที่สำคัญกว่านั้นคือ บรรลุการก้าวกระโดดเชิงคุณภาพในด้านประสบการณ์ผู้ใช้ มอบทิศทางใหม่สำหรับการพัฒนาปฏิสัมพันธ์ของ AI ในอนาคต และมันก็คุ้มค่าที่จะรอคอยนวัตกรรมเพิ่มเติมในการติดตาม ขึ้น.