Hume AI 宣布推出其實驗性功能“語音控制”,這項革新功能允許用戶無需任何編程或AI專業知識,即可輕鬆定制個性化AI語音。透過直覺的虛擬滑桿,使用者可以精準調節十個不同維度的聲音特徵,例如性別、自信度、熱情等,創造出符合各種應用場景的獨特語音。此功能建立在Hume先前推出的「共感語音介面2」(EVI2)的基礎上,進一步提升了語音的自然度、情緒表達和可自訂性。
Hume AI,這家專注於情緒智慧語音介面的新創公司,近日推出了一項名為「語音控制」 的實驗性功能。
這個新工具旨在幫助開發者和使用者無需任何編碼、AI 提示工程或音效設計技能,就能創造出個人化的AI 聲音。使用者可透過精確調節聲音特徵,輕鬆自訂符合需求的聲音。
這項新功能建立在公司先前推出的「共感語音介面2」(EVI2)的基礎上,EVI2增強了語音的自然性、情緒反應能力和可自訂性。與傳統的語音複製技術不同,Hume 的產品專注於提供獨特且富有表現力的聲音,以滿足客戶服務聊天機器人、數位助理、教師、導遊以及無障礙功能等多種應用的需求。
語音控制功能讓開發者在十個不同的維度上調整聲音特徵,包括性別、果斷性、興奮度、自信心等。
「男性/女性:性別的發聲,範圍在更男性化和更女性化之間。
自信度:聲音的堅定度,介於膽怯與大膽之間。
浮力:聲音的密度,範圍介於放氣和浮力之間。
自信:聲音的確定程度,介於害羞與自信。
熱情:聲音中的興奮,介於平靜與熱情之間。
鼻音:聲音的開放度,範圍在清晰與鼻音之間。
放鬆度:聲音中的壓力,介於緊張與放鬆之間。
平滑度:聲音的質感,介於平滑和斷奏之間。
溫和:聲音背後的活力,介於溫和與有力之間。
緊密度:聲音的包容度,範圍介於緊密和氣喘吁籲之間。 」
使用者可以透過虛擬滑桿即時微調這些屬性,讓自訂變得簡單明了。該功能目前在Hume 的虛擬平台中提供,用戶只需免費註冊即可存取。
語音控制目前已推出測試版本,並與Hume 的Empathic Voice Interface (EVI) 集成,使其可用於廣泛的應用程式。開發人員可以選擇基本語音,調整其特性,並即時預覽結果。此流程可確保會話間的可重複性和穩定性,這是客戶服務機器人或虛擬助理等即時應用程式的關鍵功能。
EVI2的影響在語音控制功能上顯而易見。早期型號引入了對話提示和多語言功能等功能,這些功能拓寬了語音AI 應用的範圍。例如,EVI2支援亞秒響應時間,實現自然、即時的對話。它還允許在互動過程中動態調整說話風格,使其成為企業的多功能工具。
此舉正是為了解決AI 產業中對預設聲音的依賴問題,許多品牌或應用往往難以找到滿足其需求的聲音。 Hume 的目標是開發出情感細緻的語音AI,推動產業進步。 EVI2在2024年9月發佈時就已經大幅提升了語音的延遲和成本效益,並為語音調節功能提供了安全的替代方案。
Hume 的研究驅動方法在產品開發中佔據核心地位,結合了跨文化的聲音錄音和情感調查數據。這個方法論構成了EVI2和新推出的語音控制的基礎,使其能夠細緻地捕捉人類對聲音的感知。
目前,語音控制已在測試版中推出,並與Hume 的共感語音介面(EVI)結合,支援多種應用情境。開發者可以選擇基礎聲音,調整其特性,並即時預覽結果,確保在客戶服務或虛擬助理等即時應用中的一致性和穩定性。
隨著市場上競爭的加劇,Hume 的個人化語音和情感智慧定位使其在語音AI 領域中脫穎而出。未來,Hume 計畫擴展語音控制的功能,增加可調節維度,優化聲音質量,並增加基礎聲音的選擇範圍。
官方部落格:https://www.hume.ai/blog/introducing-voice-control
劃重點:
? **Hume AI 推出了「語音控制」 功能,使用者可輕鬆創建個人化AI 聲音。 **
?️ ** 此功能無須編碼技能,使用者可透過滑桿調整聲音特徵。 **
? **Hume 旨在透過個人化和情感智能的語音AI 來滿足多樣化的應用需求。 **
總而言之,Hume AI 的「語音控制」功能為AI 語音定制帶來了前所未有的便利性,其個性化和情感智能的特性將極大地拓展AI 語音在各個領域的應用,值得期待其未來的發展和功能升級。