Play AI เปิดตัวผลงานชิ้นเอกล่าสุดอย่างยิ่งใหญ่ นั่นคือ PlayDialog เวอร์ชันเบต้า ซึ่งเป็นโมเดลเสียง AI ที่สามารถสร้างเสียงพอดแคสต์แบบสนทนาได้ ไม่เพียงแต่สามารถปรับน้ำเสียง อารมณ์ และความเร็วในการพูดตามบริบททางประวัติศาสตร์ของการสนทนา บรรลุการสังเคราะห์คำพูดที่เป็นธรรมชาติมากขึ้น แต่ยังสร้างประสบการณ์การสื่อสารด้วยเสียงที่ดื่มด่ำ ซึ่งสามารถเรียกได้ว่าเป็นเหตุการณ์สำคัญครั้งใหม่ในบทสนทนาระหว่างมนุษย์กับคอมพิวเตอร์ โปรแกรมแก้ไข Downcodes จะอธิบายรายละเอียดเกี่ยวกับฟังก์ชันอันทรงพลังของ PlayDialog และเครื่องมือสนับสนุน PlayNote
เมื่อเร็วๆ นี้ Play AI ได้เปิดตัวผลิตภัณฑ์ที่มีความทะเยอทะยานที่สุดอย่างเป็นทางการ นั่นคือ PlayDialog เวอร์ชันเบต้า ซึ่งสามารถสร้างเสียงพอดแคสต์แบบสนทนาได้
โมเดลคำพูด AI แบบ end-to-end นี้ใช้บริบทในอดีตของการสนทนาเพื่อควบคุมน้ำเสียง อารมณ์ และความเร็วของคำพูด เพื่อให้เกิดการสังเคราะห์คำพูดที่เป็นธรรมชาติมากขึ้น ถือเป็นก้าวใหม่ของบทสนทนาระหว่างมนุษย์กับเครื่องจักร PlayDialog เหมาะอย่างยิ่งสำหรับการสร้างประสบการณ์การสนทนาที่แท้จริง เช่น การบรรยาย การพากย์เสียง พอดแคสต์สังเคราะห์ ฯลฯ นอกจากนี้ยังสามารถมอบประสบการณ์การสื่อสารด้วยเสียงแบบตัวต่อตัวที่ดื่มด่ำในสภาพแวดล้อมทางธุรกิจ คล้ายกับ NotebookLM ของ Google
ในเวลาเดียวกัน Play AI ยังได้เปิดตัว PlayNote ซึ่งเป็นเครื่องมือที่สามารถแปลงไฟล์มีเดียต่างๆ (เช่น PDF, ข้อความ, วิดีโอ ฯลฯ) ให้เป็นประสบการณ์การสนทนา ผู้ใช้สามารถสร้างพอดแคสต์ การนำเสนอ คำบรรยาย และแม้แต่เรื่องราวของเด็ก ๆ ได้ในเวลาไม่กี่นาที และเพลิดเพลินกับเอฟเฟกต์เสียงที่นุ่มนวลและเป็นธรรมชาติจาก PlayDialog ความพิเศษของ PlayNote คือยังมีอินเทอร์เฟซ API ซึ่งช่วยให้ผู้ใช้สามารถสร้างเนื้อหาเสียงแบบเป็นโปรแกรมได้อย่างง่ายดายโดยไม่ต้องอาศัยอินเทอร์เฟซผู้ใช้
PlayDialog เบต้าได้รับการฝึกฝนเกี่ยวกับการสนทนาจริงหลายร้อยล้านรายการ ขนาดของโมเดลนั้นประมาณ 10 เท่าของ Play AI3.0mini และสามารถจับคู่ประสิทธิภาพคำพูดของมนุษย์ในแง่ของน้ำเสียง (เช่น จังหวะของเสียงและความเร็วของ คำพูด). ในการทดสอบแบบ blind test นั้น PlayDialog เบต้าทำงานได้สองครั้งเช่นเดียวกับรุ่นคู่แข่งชั้นนำในตลาด โดยให้คะแนนสูงสุดโดยเฉพาะในด้านการแสดงออก
ต่างจากโมเดลคำพูดก่อนหน้านี้ PlayDialog เบต้าสามารถเข้าใจบริบทของการสนทนาทั้งหมดได้ ซึ่งจะส่งผลต่อผลกระทบของการสร้างคำพูด Play AI ได้สร้างสถาปัตยกรรมใหม่ที่เรียกว่า Adaptive Speech Contextualizer (ASC) ซึ่งช่วยให้โมเดลสามารถตอบสนองโดยใช้ประวัติการสนทนาที่สมบูรณ์ เพื่อให้แต่ละประโยคไม่ใช่เอาท์พุตที่แยกออกมา แต่เป็นเอาท์พุตที่สมบูรณ์ มีน้ำเสียง อารมณ์ และเหมาะสม โทนเสียงทำให้พอดแคสต์ที่ได้ออกมาให้ความรู้สึกเหมือนกับว่าผู้ฟังกำลังสื่อสารอยู่ในพื้นที่เดียวกับผู้พูด
ไม่ว่าจะเป็นการสนทนาแบบไดนามิกหรือหัวข้อละเอียดอ่อนที่ต้องใช้ความเห็นอกเห็นใจ PlayDialog จะปรับตัวได้อย่างราบรื่น ทำให้การโต้ตอบรู้สึกเป็นธรรมชาติและเป็นมนุษย์มากขึ้น
ผู้ใช้สามารถสัมผัสประสบการณ์ทั้งหมดนี้ด้วย PlayNote โดยใช้เพื่อสร้างคำบรรยายที่มีประสิทธิภาพและเป็นธรรมชาติ พอดแคสต์ การนำเสนอ และอื่นๆ อีกมากมายในเวลาเพียงไม่กี่นาที PlayNote ยังมีให้บริการผ่านอินเทอร์เฟซ API ซึ่งช่วยให้นักพัฒนาสามารถสร้างเนื้อหาที่น่าสนใจในวงกว้างโดยทางโปรแกรม
ทางเข้าเตี่ย: https://play.ai/playnote
แนะนำบล็อกอย่างเป็นทางการ: https://blog.play.ai/blog/introuring-playdialog
การเกิดขึ้นของ PlayDialog และ PlayNote จะผลักดันเทคโนโลยีการสังเคราะห์เสียงพูดของ AI ไปสู่ระดับใหม่อย่างไม่ต้องสงสัย และนำการเปลี่ยนแปลงที่ปฏิวัติวงการมาสู่การผลิตพอดแคสต์ การสื่อสารด้วยเสียง และสาขาอื่น ๆ เราหวังว่าจะได้นวัตกรรมที่น่าประหลาดใจจาก Play AI ในอนาคต!