ElevenLabs ได้เปิดตัว Flash รูปแบบการสังเคราะห์เสียงพูดใหม่ ซึ่งปัจจุบันเป็นโซลูชันการอ่านออกเสียงข้อความ (TTS) ที่เร็วที่สุดโดยมีความหน่วงต่ำมากเพียง 75 มิลลิวินาที การพัฒนาที่ก้าวล้ำนี้เหมาะอย่างยิ่งสำหรับแอปพลิเคชัน AI การสนทนาที่ต้องการการโต้ตอบแบบเรียลไทม์ ซึ่งช่วยปรับปรุงความราบรื่นและความเป็นธรรมชาติของการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ได้อย่างมาก โมเดล Flash มีให้เลือกสองเวอร์ชัน: Flash v2 (รองรับภาษาอังกฤษ) และ Flash v2.5 (รองรับ 32 ภาษา) ผู้ใช้สามารถสัมผัสได้โดยตรงผ่านแพลตฟอร์ม AI และ API การสนทนาของ ElevenLabs แม้ว่าคุณภาพเสียงและการแสดงออกทางอารมณ์จะด้อยกว่ารุ่น Turbo เล็กน้อย แต่ Flash ก็นำหน้าอย่างชัดเจนในแง่ของความเร็วและออกมาเป็นอันดับหนึ่งในการทดสอบแบบ Blind Test
รุ่น Flash แบ่งออกเป็นสองเวอร์ชัน Flash v2 รองรับเฉพาะภาษาอังกฤษ และ Flash v2.5 รองรับ 32 ภาษา เมื่อใช้ทั้งสองรุ่น ผู้ใช้จะใช้ 1 แต้มต่อทุกๆ 2 ตัวละครที่สร้างขึ้น แม้ว่ารุ่น Flash จะด้อยกว่ารุ่น Turbo เล็กน้อยในแง่ของคุณภาพเสียงและความลึกของอารมณ์ แต่ประสิทธิภาพที่มีความหน่วงต่ำทำให้สามารถก้าวข้ามรุ่นที่เหลือในประเภทเดียวกันในการทดสอบแบบ blind ทำให้เป็นตัวเลือกที่เร็วที่สุดในระดับเดียวกัน
ทีมเทคนิคของ ElevenLabs กล่าวว่าการเปิดตัวโมเดล Flash จะช่วยส่งเสริมความราบรื่นและความเป็นธรรมชาติของการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์อย่างมาก นักพัฒนาสามารถเรียกรหัสโมเดล "eleven_flash_v2" และ "eleven_flash_v2_5" ได้โดยตรงผ่าน API สามารถดูข้อมูลอ้างอิง API เฉพาะได้บนเว็บไซต์อย่างเป็นทางการของ ElevenLabs ด้วยนวัตกรรมนี้ ElevenLabs หวังที่จะเปิดฉากการสนทนาและการโต้ตอบที่มีมนุษยธรรมและมีเวลาแฝงต่ำมากขึ้น
ElevenLabs ยังนำเสนอผลิตภัณฑ์และโซลูชันที่หลากหลาย รวมถึงผู้ช่วยด้านเสียงที่ปรับแต่งได้ เครื่องมือการผลิตเสียง และสตูดิโอพากย์เสียง ซึ่งออกแบบมาเพื่อช่วยให้ผู้ใช้และนักพัฒนาในสาขาต่างๆ สามารถสร้างเสียง AI คุณภาพสูงได้ นอกจากนี้ ElevenLabs ยังดำเนินการวิจัยและพัฒนาอย่างแข็งขัน และยังคงปรับปรุงระดับเทคนิคของผลิตภัณฑ์อย่างต่อเนื่องเพื่อตอบสนองความต้องการที่เพิ่มขึ้นของผู้ใช้
ไฮไลท์:
เวลาแฝงของโมเดล Flash ในการสร้างเสียงพูดอยู่ที่เพียง 75 มิลลิวินาที ซึ่งเหมาะสำหรับผู้ช่วยเสียงสนทนาที่มีความหน่วงต่ำ
Flash v2.5 รองรับ 32 ภาษา และอักขระสองตัวแต่ละตัวที่สร้างโดยผู้ใช้มีค่าใช้จ่าย 1 คะแนน
ในการทดสอบแบบสุ่มตัวอย่าง Flash มีประสิทธิภาพเหนือกว่าผลิตภัณฑ์อื่นๆ ที่คล้ายคลึงกัน และกลายเป็นโซลูชันการอ่านออกเสียงข้อความที่เร็วที่สุด
โดยสรุปแล้ว โมเดล Flash ของ ElevenLabs นำเสนอความเป็นไปได้ใหม่ๆ ให้กับแอปพลิเคชัน AI การสนทนา ด้วยเวลาแฝงที่ต่ำเป็นพิเศษและการรองรับหลายภาษา และยังบ่งชี้ว่าการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์จะราบรื่นและเป็นธรรมชาติมากขึ้นในอนาคต ข้อได้เปรียบด้านความเร็วทำให้เป็นหนึ่งในโซลูชันการอ่านออกเสียงข้อความชั้นนำในตลาดและสมควรได้รับความสนใจจากนักพัฒนาและผู้ใช้