Cartesia เปิดตัวโมเดลการแปลงคำพูดใหม่: สามารถรักษาลักษณะโทนเสียงของผู้พูดได้

ผู้เขียน：Eve Cole เวลาอัปเดต：2024-11-29 10:12:01

บริษัทปัญญาประดิษฐ์ Cartesia ได้เปิดตัวโมเดลการแปลงคำพูดที่เรียกว่า Voice Changer ซึ่งสามารถแปลงคำพูดโดยยังคงรักษาน้ำเสียงและสำเนียงของเสียงต้นฉบับและคุณสมบัติการแสดงออกอื่น ๆ เทคโนโลยีนี้ค่อนข้างหายากในตลาด แตกต่างจากเครื่องมือแปลงเสียงแบบเดิมที่มักจะสูญเสียการเปลี่ยนแปลงโทนเสียงของผู้พูด ทำให้เสียงที่แปลงแล้วมีกลไกมากขึ้น Voice Changer ของ Cartesia ให้ความสำคัญกับการฟื้นฟูอารมณ์และน้ำเสียงของผู้พูดมากขึ้นในขณะที่ยังคงการแปลงเสียงไว้ ซึ่งช่วยปรับปรุงความสมจริงและความเป็นธรรมชาติของการแปลงคำพูดได้อย่างมีนัยสำคัญ ได้รับการปรับปรุง เครื่องมือแก้ไขของ Downcodes จะพาคุณไปเจาะลึกโมเดลใหม่นี้

บริษัทปัญญาประดิษฐ์ Cartesia เพิ่งเปิดตัวโมเดลการแปลงคำพูดที่เรียกว่า Voice Changer แตกต่างจากการแปลงคำพูดแบบดั้งเดิม รุ่นนี้ไม่เพียงแต่สามารถแปลงคำพูดอินพุตให้เป็นเสียงเป้าหมายได้ แต่ยังรักษาน้ำเสียง ความเครียด และลักษณะการแสดงออกอื่นๆ ของเสียงต้นฉบับอีกด้วย

ตามที่เจ้าหน้าที่ของ Cartesia ระบุว่าผู้ใช้สามารถลองใช้คุณสมบัตินี้ได้บนเว็บไซต์ play.cartesia.ai ในปัจจุบัน บริษัทได้เปิดตัวเอกสาร API ที่เกี่ยวข้อง และนักพัฒนาสามารถดูคำแนะนำโดยละเอียดได้ที่ docs.cartesia.ai

ผู้สื่อข่าวสังเกตเห็นว่าเทคโนโลยีการแปลงประเภทนี้ที่ยังคงลักษณะเสียงไว้นั้นไม่มีอยู่ทั่วไปในตลาด เครื่องมือที่มีอยู่ส่วนใหญ่มักจะสูญเสียการผันเสียงของผู้พูดเมื่อแปลงเสียง ทำให้เสียงที่แปลงแล้วกลายเป็นเสียงหุ่นยนต์

Cartesia ให้รายละเอียดว่าเทคโนโลยีนี้ถูกนำไปใช้อย่างไรในบล็อกของตน อย่างไรก็ตาม บริษัทยังไม่ได้ตอบสนองต่อประเด็นด้านจริยธรรมที่อาจนำมาซึ่งเทคโนโลยีนี้ เช่น การเลียนแบบเสียงของผู้อื่นโดยไม่ได้รับอนุญาต

การเกิดขึ้นของโมเดล Voice Changer ได้นำมาซึ่งความก้าวหน้าครั้งใหม่มาสู่เทคโนโลยีการแปลงเสียง แต่ยังทำให้เกิดข้อกังวลเกี่ยวกับปัญหาด้านจริยธรรมอีกด้วย หวังว่า Cartesia สามารถทำการวิจัยเชิงลึกและอภิปรายเพิ่มเติมเกี่ยวกับความเสี่ยงที่อาจเกิดขึ้นเหล่านี้ในอนาคตเพื่อให้แน่ใจว่ามีการใช้เทคโนโลยีอย่างสมเหตุสมผล บรรณาธิการของ Downcodes จะยังคงให้ความสนใจกับการพัฒนาเทคโนโลยีนี้ต่อไป