告別語音克隆侵權！ Hume AI推出語音控制功能，可創造個人化AI語音

作者：Eve Cole 更新時間：2024-12-17 14:32:02

Hume AI 宣布推出其實驗性功能“語音控制”，這項革新功能允許用戶無需任何編程或AI專業知識，即可輕鬆定制個性化AI語音。透過直覺的虛擬滑桿，使用者可以精準調節十個不同維度的聲音特徵，例如性別、自信度、熱情等，創造出符合各種應用場景的獨特語音。此功能建立在Hume先前推出的「共感語音介面2」（EVI2）的基礎上，進一步提升了語音的自然度、情緒表達和可自訂性。

Hume AI，這家專注於情緒智慧語音介面的新創公司，近日推出了一項名為「語音控制」的實驗性功能。

這個新工具旨在幫助開發者和使用者無需任何編碼、AI 提示工程或音效設計技能，就能創造出個人化的AI 聲音。使用者可透過精確調節聲音特徵，輕鬆自訂符合需求的聲音。

這項新功能建立在公司先前推出的「共感語音介面2」（EVI2）的基礎上，EVI2增強了語音的自然性、情緒反應能力和可自訂性。與傳統的語音複製技術不同，Hume 的產品專注於提供獨特且富有表現力的聲音，以滿足客戶服務聊天機器人、數位助理、教師、導遊以及無障礙功能等多種應用的需求。

語音控制功能讓開發者在十個不同的維度上調整聲音特徵，包括性別、果斷性、興奮度、自信心等。

「男性/女性:性別的發聲，範圍在更男性化和更女性化之間。

自信度:聲音的堅定度，介於膽怯與大膽之間。

浮力:聲音的密度，範圍介於放氣和浮力之間。

自信:聲音的確定程度，介於害羞與自信。

熱情:聲音中的興奮，介於平靜與熱情之間。

鼻音:聲音的開放度，範圍在清晰與鼻音之間。

放鬆度:聲音中的壓力，介於緊張與放鬆之間。

平滑度:聲音的質感，介於平滑和斷奏之間。

溫和:聲音背後的活力，介於溫和與有力之間。

緊密度:聲音的包容度，範圍介於緊密和氣喘吁籲之間。」

使用者可以透過虛擬滑桿即時微調這些屬性，讓自訂變得簡單明了。該功能目前在Hume 的虛擬平台中提供，用戶只需免費註冊即可存取。

語音控制目前已推出測試版本，並與Hume 的Empathic Voice Interface （EVI）集成，使其可用於廣泛的應用程式。開發人員可以選擇基本語音，調整其特性，並即時預覽結果。此流程可確保會話間的可重複性和穩定性，這是客戶服務機器人或虛擬助理等即時應用程式的關鍵功能。

EVI2的影響在語音控制功能上顯而易見。早期型號引入了對話提示和多語言功能等功能，這些功能拓寬了語音AI 應用的範圍。例如，EVI2支援亞秒響應時間，實現自然、即時的對話。它還允許在互動過程中動態調整說話風格，使其成為企業的多功能工具。

此舉正是為了解決AI 產業中對預設聲音的依賴問題，許多品牌或應用往往難以找到滿足其需求的聲音。 Hume 的目標是開發出情感細緻的語音AI，推動產業進步。 EVI2在2024年9月發佈時就已經大幅提升了語音的延遲和成本效益，並為語音調節功能提供了安全的替代方案。

Hume 的研究驅動方法在產品開發中佔據核心地位，結合了跨文化的聲音錄音和情感調查數據。這個方法論構成了EVI2和新推出的語音控制的基礎，使其能夠細緻地捕捉人類對聲音的感知。

目前，語音控制已在測試版中推出，並與Hume 的共感語音介面（EVI）結合，支援多種應用情境。開發者可以選擇基礎聲音，調整其特性，並即時預覽結果，確保在客戶服務或虛擬助理等即時應用中的一致性和穩定性。

隨著市場上競爭的加劇，Hume 的個人化語音和情感智慧定位使其在語音AI 領域中脫穎而出。未來，Hume 計畫擴展語音控制的功能，增加可調節維度，優化聲音質量，並增加基礎聲音的選擇範圍。

官方部落格:https://www.hume.ai/blog/introducing-voice-control

劃重點:

? **Hume AI 推出了「語音控制」功能，使用者可輕鬆創建個人化AI 聲音。 **

?️ ** 此功能無須編碼技能，使用者可透過滑桿調整聲音特徵。 **

? **Hume 旨在透過個人化和情感智能的語音AI 來滿足多樣化的應用需求。 **

總而言之，Hume AI 的「語音控制」功能為AI 語音定制帶來了前所未有的便利性，其個性化和情感智能的特性將極大地拓展AI 語音在各個領域的應用，值得期待其未來的發展和功能升級。