Hume AI ประกาศเปิดตัวฟีเจอร์ทดลอง "การควบคุมด้วยเสียง" ซึ่งเป็นฟีเจอร์นวัตกรรมที่ช่วยให้ผู้ใช้ปรับแต่งเสียง AI ส่วนบุคคลได้อย่างง่ายดาย โดยไม่ต้องเขียนโปรแกรมหรือเชี่ยวชาญด้าน AI ด้วยแถบเลื่อนเสมือนที่ใช้งานง่าย ผู้ใช้สามารถปรับลักษณะเสียงที่แตกต่างกันได้ 10 มิติ เช่น เพศ ความมั่นใจ ความกระตือรือร้น ฯลฯ เพื่อสร้างเสียงที่เป็นเอกลักษณ์ที่เหมาะกับสถานการณ์การใช้งานต่างๆ ฟีเจอร์นี้ต่อยอดจาก “Empathic Voice Interface 2” (EVI2) ที่เปิดตัวก่อนหน้านี้ของ Hume ซึ่งปรับปรุงความเป็นธรรมชาติ การแสดงออกทางอารมณ์ และความสามารถในการปรับแต่งคำพูดให้ดียิ่งขึ้น
Hume AI สตาร์ทอัพที่เน้นอินเทอร์เฟซเสียงอัจฉริยะทางอารมณ์ เพิ่งเปิดตัวฟีเจอร์ทดลองที่เรียกว่า "การควบคุมด้วยเสียง"
เครื่องมือใหม่นี้ได้รับการออกแบบมาเพื่อช่วยให้นักพัฒนาและผู้ใช้สร้างเสียง AI ส่วนบุคคลโดยไม่ต้องเขียนโค้ด วิศวกรรมพร้อมท์ AI หรือทักษะการออกแบบเสียง ผู้ใช้สามารถปรับแต่งเสียงให้เหมาะกับความต้องการได้อย่างง่ายดายโดยการปรับลักษณะเสียงอย่างแม่นยำ
คุณสมบัติใหม่นี้สร้างขึ้นจาก Empathic Voice Interface 2 (EVI2) ที่เปิดตัวก่อนหน้านี้ของบริษัท ซึ่งเพิ่มความเป็นธรรมชาติ การตอบสนองทางอารมณ์ และความสามารถในการปรับแต่งคำพูด ต่างจากเทคโนโลยีโคลนเสียงแบบดั้งเดิม ผลิตภัณฑ์ของ Hume มุ่งเน้นไปที่การส่งเสียงที่เป็นเอกลักษณ์และแสดงออก เพื่อตอบสนองความต้องการของแอปพลิเคชันที่หลากหลาย รวมถึงแชทบอทบริการลูกค้า ผู้ช่วยดิจิทัล ครู ไกด์นำเที่ยว และฟีเจอร์การเข้าถึง
การควบคุมด้วยเสียงช่วยให้นักพัฒนาสามารถปรับลักษณะเสียงตามมิติต่างๆ ได้ถึง 10 มิติ รวมถึงเพศ ความกล้าแสดงออก ความตื่นเต้น ความมั่นใจ และอื่นๆ อีกมากมาย
“ชาย/หญิง: การเปล่งเสียงตามเพศที่มีช่วงระหว่างความเป็นชายมากกว่าและเป็นผู้หญิงมากกว่า
ความมั่นใจ: ความหนักแน่นของน้ำเสียง ระหว่างความขี้กลัวและความกล้าหาญ
การลอยตัว: ความหนาแน่นของเสียง ซึ่งอยู่ระหว่างภาวะเงินฝืดและการลอยตัว
ความมั่นใจ: ระดับความมั่นใจในน้ำเสียง ระหว่างความเขินอายและความมั่นใจ
ความกระตือรือร้น: ความตื่นเต้นในน้ำเสียง อยู่ระหว่างความสงบและความกระตือรือร้น
จมูก: การเปิดกว้างของเสียง อยู่ระหว่างเสียงใสและจมูก
การผ่อนคลาย: ความกดดันในเสียง ระหว่างความตึงเครียดกับการผ่อนคลาย
ความนุ่มนวล: เนื้อสัมผัสของเสียงอยู่ระหว่างความนุ่มนวลและเสียงสแตคคาโต
ความอ่อนโยน: พลังเบื้องหลังเสียง อยู่ระหว่างความอ่อนโยนและทรงพลัง
ความแน่น: เสียงมีความแน่นแค่ไหน มีทั้งแน่นและหายใจไม่ออก -
ผู้ใช้สามารถปรับแต่งคุณสมบัติเหล่านี้ได้แบบเรียลไทม์ผ่านแถบเลื่อนเสมือน ทำให้การปรับแต่งทำได้ง่ายและตรงไปตรงมา ขณะนี้ฟีเจอร์นี้มีให้บริการในแพลตฟอร์มเสมือนของ Hume และผู้ใช้สามารถเข้าถึงได้โดยเพียงลงทะเบียนฟรี
ขณะนี้การควบคุมด้วยเสียงมีให้บริการในรุ่นเบต้าและทำงานร่วมกับ Empathic Voice Interface (EVI) ของ Hume ทำให้สามารถใช้งานได้หลากหลาย นักพัฒนาสามารถเลือกเสียงพื้นฐาน ปรับคุณลักษณะ และดูตัวอย่างผลลัพธ์แบบเรียลไทม์ กระบวนการนี้รับประกันความสามารถในการทำซ้ำและความเสถียรจากเซสชันหนึ่งไปอีกเซสชันหนึ่ง ซึ่งเป็นคุณลักษณะสำคัญของแอปพลิเคชันแบบเรียลไทม์ เช่น บอทบริการลูกค้าหรือผู้ช่วยเสมือน
ผลกระทบของ EVI2 ปรากฏชัดในฟังก์ชันการควบคุมด้วยเสียง โมเดลแรกๆ นำเสนอฟีเจอร์ต่างๆ เช่น ข้อความแจ้งการสนทนาและความสามารถหลายภาษาที่ขยายขอบเขตของแอปพลิเคชัน AI เสียง ตัวอย่างเช่น EVI2 รองรับเวลาตอบสนองรองวินาทีสำหรับการสนทนาที่เป็นธรรมชาติและทันที นอกจากนี้ยังช่วยให้สามารถปรับรูปแบบการพูดแบบไดนามิกในระหว่างการโต้ตอบ ทำให้เป็นเครื่องมืออเนกประสงค์สำหรับธุรกิจ
การเคลื่อนไหวครั้งนี้มีไว้เพื่อแก้ปัญหาการพึ่งพาเสียงที่ตั้งไว้ล่วงหน้าในอุตสาหกรรม AI หลายๆ แบรนด์หรือแอปพลิเคชันมักประสบปัญหาในการค้นหาเสียงที่ตรงกับความต้องการของตน เป้าหมายของ Hume คือการพัฒนา AI เสียงที่ไวต่ออารมณ์ และส่งเสริมความก้าวหน้าของอุตสาหกรรม เมื่อ EVI2 เปิดตัวในเดือนกันยายน 2024 จะปรับปรุงเวลาแฝงและความคุ้มค่าของเสียงได้อย่างมาก และมอบทางเลือกที่ปลอดภัยสำหรับฟังก์ชันการปรับเสียง
แนวทางที่ขับเคลื่อนด้วยการวิจัยของ Hume เป็นหัวใจสำคัญของการพัฒนาผลิตภัณฑ์ โดยผสมผสานการบันทึกเสียงข้ามวัฒนธรรมและข้อมูลการสำรวจอารมณ์ วิธีการนี้เป็นพื้นฐานของ EVI2 และการควบคุมด้วยเสียงที่เพิ่งเปิดตัวใหม่ ทำให้สามารถจับการรับรู้เสียงของมนุษย์ได้อย่างละเอียด
ปัจจุบัน การควบคุมด้วยเสียงเปิดตัวในเวอร์ชันเบต้าและรวมเข้ากับ Empathic Voice Interface (EVI) ของ Hume เพื่อรองรับสถานการณ์การใช้งานที่หลากหลาย นักพัฒนาสามารถเลือกเสียงพื้นฐาน ปรับคุณลักษณะ และดูตัวอย่างผลลัพธ์แบบเรียลไทม์ เพื่อให้มั่นใจถึงความสม่ำเสมอและความเสถียรในแอปพลิเคชันแบบเรียลไทม์ เช่น การบริการลูกค้าหรือผู้ช่วยเสมือน
ขณะที่การแข่งขันในตลาดทวีความรุนแรงขึ้น การวางตำแหน่งด้านเสียงและความฉลาดทางอารมณ์ส่วนบุคคลของ Hume ทำให้ Hume มีความโดดเด่นในด้าน AI ด้านเสียง ในอนาคต ฮูมวางแผนที่จะขยายฟังก์ชันการควบคุมด้วยเสียง เพิ่มขนาดที่ปรับได้ ปรับคุณภาพเสียงให้เหมาะสม และเพิ่มการเลือกเสียงพื้นฐาน
บล็อกอย่างเป็นทางการ: https://www.hume.ai/blog/introcing-voice-control
ไฮไลท์:
? **Hume AI ได้เปิดตัวฟังก์ชัน "การควบคุมด้วยเสียง" ช่วยให้ผู้ใช้สามารถสร้างเสียง AI ส่วนบุคคลได้อย่างง่ายดาย -
️ ** คุณสมบัตินี้ไม่ต้องใช้ทักษะการเขียนโค้ด และผู้ใช้สามารถปรับลักษณะเสียงผ่านแถบเลื่อนได้ -
? **ฮูมได้รับการออกแบบมาเพื่อตอบสนองความต้องการการใช้งานที่หลากหลายผ่าน AI เสียงที่ชาญฉลาดและเป็นส่วนตัว -
โดยรวมแล้ว ฟังก์ชัน "การควบคุมด้วยเสียง" ของ Hume AI ช่วยให้การปรับแต่งเสียงของ AI สะดวกสบายอย่างที่ไม่เคยมีมาก่อน จะช่วยขยายการใช้งานเสียงของ AI ในด้านต่างๆ อย่างมาก คุ้มค่าที่จะรอคอยการพัฒนาและอัปเกรดฟังก์ชันในอนาคต .