Hume AI ได้ประกาศเปิดตัวฟีเจอร์การควบคุมด้วยเสียงที่ปฏิวัติวงการ ซึ่งเป็นฟีเจอร์ทดลองที่ช่วยให้ผู้ใช้สามารถสร้างเสียง AI ที่เป็นส่วนตัวได้ในระดับสูง โดยไม่ต้องเขียนโค้ดหรือเชี่ยวชาญใดๆ คุณลักษณะนี้ใช้ Empathic Voice Interface 2 (EVI2) ของ Hume ซึ่งเพิ่มความเป็นธรรมชาติ การแสดงออกทางอารมณ์ และความสามารถในการปรับแต่งคำพูด ทำให้นักพัฒนาและผู้ใช้มีระดับการควบคุมที่ไม่เคยมีมาก่อนเพื่อสร้างโซลูชันที่ตอบสนองความต้องการด้านแอปพลิเคชันที่หลากหลาย เช่น แชทบอทบริการลูกค้า ผู้ช่วยดิจิทัล เครื่องมือทางการศึกษา และอื่นๆ อีกมากมาย เทคโนโลยีที่เป็นนวัตกรรมนี้คาดว่าจะปฏิวัติอุตสาหกรรมเสียง AI และช่วยให้ผู้ใช้ได้รับประสบการณ์เสียงที่รอบคอบและเป็นส่วนตัวมากขึ้น
Hume AI สตาร์ทอัพที่เน้นอินเทอร์เฟซเสียงอัจฉริยะทางอารมณ์ เพิ่งเปิดตัวฟีเจอร์ทดลองที่เรียกว่า "การควบคุมด้วยเสียง"
เครื่องมือใหม่นี้ได้รับการออกแบบมาเพื่อช่วยให้นักพัฒนาและผู้ใช้สร้างเสียง AI ส่วนบุคคลโดยไม่ต้องเขียนโค้ด วิศวกรรมพร้อมท์ AI หรือทักษะการออกแบบเสียง ผู้ใช้สามารถปรับแต่งเสียงให้เหมาะกับความต้องการได้อย่างง่ายดายโดยการปรับลักษณะเสียงอย่างแม่นยำ
ฟีเจอร์ใหม่นี้สร้างขึ้นจาก Empathic Voice Interface 2 (EVI2) ที่เปิดตัวก่อนหน้านี้ของบริษัท ซึ่งเพิ่มความเป็นธรรมชาติ การตอบสนองทางอารมณ์ และความสามารถในการปรับแต่งคำพูด แตกต่างจากเทคโนโลยีโคลนเสียงแบบดั้งเดิม ผลิตภัณฑ์ของ Hume มุ่งเน้นไปที่การส่งเสียงที่เป็นเอกลักษณ์และแสดงออก เพื่อตอบสนองความต้องการของแอปพลิเคชันที่หลากหลาย เช่น แชทบอทบริการลูกค้า ผู้ช่วยดิจิทัล ครู ไกด์นำเที่ยว และฟีเจอร์การเข้าถึง
การควบคุมด้วยเสียงช่วยให้นักพัฒนาสามารถปรับลักษณะเสียงตามมิติต่างๆ ได้ถึง 10 มิติ รวมถึงเพศ ความกล้าแสดงออก ความตื่นเต้น ความมั่นใจ และอื่นๆ อีกมากมาย
“ชาย/หญิง: การเปล่งเสียงตามเพศที่มีช่วงระหว่างความเป็นชายมากกว่าและเป็นผู้หญิงมากกว่า
ความมั่นใจ: ความหนักแน่นของน้ำเสียง ระหว่างความขี้กลัวและความกล้าหาญ
การลอยตัว: ความหนาแน่นของเสียง ซึ่งอยู่ระหว่างภาวะเงินฝืดและการลอยตัว
ความมั่นใจ: ระดับความมั่นใจในน้ำเสียง อยู่ระหว่างขี้อายและมั่นใจ
ความกระตือรือร้น: ความตื่นเต้นในน้ำเสียง อยู่ระหว่างความสงบและความกระตือรือร้น
จมูก: การเปิดกว้างของเสียง อยู่ระหว่างเสียงใสและจมูก
การผ่อนคลาย: ความกดดันในเสียง ระหว่างความตึงเครียดกับการผ่อนคลาย
ความนุ่มนวล: เนื้อสัมผัสของเสียงอยู่ระหว่างความนุ่มนวลและเสียงสแตคคาโต
ความอ่อนโยน: พลังเบื้องหลังเสียง อยู่ระหว่างความอ่อนโยนและทรงพลัง
ความแน่น: เสียงมีความแน่นแค่ไหน มีทั้งแน่นและหายใจไม่ออก -
ผู้ใช้สามารถปรับแต่งคุณสมบัติเหล่านี้ได้แบบเรียลไทม์ผ่านแถบเลื่อนเสมือน ทำให้การปรับแต่งทำได้ง่ายและตรงไปตรงมา ปัจจุบันฟีเจอร์นี้มีให้บริการในแพลตฟอร์มเสมือนของ Hume และผู้ใช้สามารถเข้าถึงได้โดยเพียงลงทะเบียนฟรี
ขณะนี้การควบคุมด้วยเสียงมีให้บริการในรุ่นเบต้าและทำงานร่วมกับ Empathic Voice Interface (EVI) ของ Hume ทำให้สามารถใช้งานได้หลากหลาย นักพัฒนาสามารถเลือกเสียงพื้นฐาน ปรับคุณลักษณะ และดูตัวอย่างผลลัพธ์แบบเรียลไทม์ กระบวนการนี้รับประกันความสามารถในการทำซ้ำและความเสถียรจากเซสชันหนึ่งไปอีกเซสชันหนึ่ง ซึ่งเป็นคุณลักษณะสำคัญของแอปพลิเคชันแบบเรียลไทม์ เช่น บอทบริการลูกค้าหรือผู้ช่วยเสมือน
ผลกระทบของ EVI2 เห็นได้ชัดเจนในฟังก์ชันการควบคุมด้วยเสียง โมเดลแรกๆ นำเสนอฟีเจอร์ต่างๆ เช่น ข้อความแจ้งการสนทนาและความสามารถหลายภาษาที่ขยายขอบเขตของแอปพลิเคชัน AI เสียง ตัวอย่างเช่น EVI2 รองรับเวลาตอบสนองรองวินาทีสำหรับการสนทนาที่เป็นธรรมชาติและทันที นอกจากนี้ยังช่วยให้สามารถปรับรูปแบบการพูดแบบไดนามิกในระหว่างการโต้ตอบ ทำให้เป็นเครื่องมืออเนกประสงค์สำหรับธุรกิจ
การเคลื่อนไหวครั้งนี้มีไว้เพื่อแก้ปัญหาการพึ่งพาเสียงที่ตั้งไว้ล่วงหน้าในอุตสาหกรรม AI หลายๆ แบรนด์หรือแอปพลิเคชันมักประสบปัญหาในการค้นหาเสียงที่ตรงกับความต้องการของตน เป้าหมายของ Hume คือการพัฒนา AI เสียงที่ไวต่ออารมณ์ และส่งเสริมความก้าวหน้าของอุตสาหกรรม เมื่อ EVI2 เปิดตัวในเดือนกันยายน 2024 จะปรับปรุงเวลาแฝงและความคุ้มค่าของเสียงได้อย่างมาก และมอบทางเลือกที่ปลอดภัยสำหรับฟังก์ชันการปรับเสียง
แนวทางที่ขับเคลื่อนด้วยการวิจัยของ Hume เป็นหัวใจสำคัญของการพัฒนาผลิตภัณฑ์ โดยผสมผสานการบันทึกเสียงข้ามวัฒนธรรมและข้อมูลการสำรวจอารมณ์ วิธีการนี้เป็นพื้นฐานของ EVI2 และการควบคุมด้วยเสียงที่เพิ่งเปิดตัวใหม่ ทำให้สามารถจับการรับรู้เสียงของมนุษย์ได้อย่างละเอียด
ปัจจุบัน การควบคุมด้วยเสียงเปิดตัวในเวอร์ชันเบต้าและรวมเข้ากับ Empathic Voice Interface (EVI) ของ Hume เพื่อรองรับสถานการณ์การใช้งานที่หลากหลาย นักพัฒนาสามารถเลือกเสียงพื้นฐาน ปรับคุณลักษณะ และดูตัวอย่างผลลัพธ์แบบเรียลไทม์ เพื่อให้มั่นใจถึงความสม่ำเสมอและความเสถียรในแอปพลิเคชันแบบเรียลไทม์ เช่น การบริการลูกค้าหรือผู้ช่วยเสมือน
ในขณะที่การแข่งขันในตลาดรุนแรงขึ้น การวางตำแหน่งด้านเสียงและความฉลาดทางอารมณ์เฉพาะบุคคลของ Hume ทำให้มีความโดดเด่นในด้าน AI ด้านเสียง ในอนาคต ฮูมวางแผนที่จะขยายฟังก์ชันการควบคุมด้วยเสียง เพิ่มขนาดที่ปรับได้ ปรับคุณภาพเสียงให้เหมาะสม และเพิ่มการเลือกเสียงพื้นฐาน
บล็อกอย่างเป็นทางการ: https://www.hume.ai/blog/introcing-voice-control
ไฮไลท์:
**Hume AI ได้เปิดตัวฟังก์ชัน "การควบคุมด้วยเสียง" ซึ่งช่วยให้ผู้ใช้สามารถสร้างเสียง AI ส่วนตัวได้อย่างง่ายดาย -
** คุณสมบัตินี้ไม่จำเป็นต้องมีทักษะการเขียนโค้ด และผู้ใช้สามารถปรับลายเซ็นเสียงได้ด้วยแถบเลื่อน -
**Hume ได้รับการออกแบบมาเพื่อตอบสนองความต้องการการใช้งานที่หลากหลายผ่าน AI เสียงที่ชาญฉลาดและเป็นส่วนตัว -
โดยรวมแล้ว ฟังก์ชัน "การควบคุมด้วยเสียง" ของ Hume AI นำความเป็นไปได้ใหม่ๆ มาสู่ขอบเขตการปรับแต่งเสียงของ AI โดยคาดว่าจะช่วยส่งเสริมการประยุกต์ใช้เทคโนโลยี AI ด้วยเสียงในวงกว้าง และทำให้ผู้ใช้ได้รับประสบการณ์การโต้ตอบด้วยเสียงที่มีมนุษยธรรมมากขึ้น ในอนาคต ด้วยการปรับปรุงและขยายฟังก์ชันอย่างต่อเนื่อง Hume AI คาดว่าจะเป็นผู้นำในด้าน AI ด้วยเสียง