ElevenLabs,一家專注於AI語音克隆和文字轉語音API的新創公司,近期推出了一個令人矚目的新功能:用戶可以自主建立完整的對話式AI智能體。這項更新標誌著ElevenLabs從單純的語音技術供應商向更全面的AI解決方案提供商的轉型,為開發者提供了前所未有的客製化空間,也預示著其在AI對話領域展開更激烈的競爭。 Downcodes小編將帶您深入了解這項新功能的強大。
使用者現在可以在ElevenLabs 的開發者平台上,依據自己的需求,客製化對話智能體的多種變量,例如語音語調和回覆長度。
ElevenLabs 過去主要提供不同的語音和文字轉語音服務。該公司成長主管Sam Sklar 在接受TechCrunch 採訪時表示,許多客戶早已在使用該平台創建對話式AI智能體。但在整合知識庫和處理客戶中斷方面是最大的挑戰。因此,ElevenLabs 決定建立一個完整的對話機器人管道,以便簡化這個過程。
使用者可以透過登入ElevenLabs 帳號,選擇範本或建立新項目來開始建立對話智能體。他們可以選擇智能體的主要語言、首條訊息和系統提示,以確定智能體的個性。
此外,開發者還需選擇大型語言模型(如Gemini、GPT 或Claude)、回應的溫度(決定創意)以及令牌使用限制。
使用者還可以根據自己的需求添加知識庫,例如文件、URL 或文字區塊,以增強對話機器人的能力。同時,他們可以將自己的自訂大型語言模型與該機器人整合。 ElevenLabs 的SDK 相容於Python、JavaScript、React 和Swift,此外,該公司還提供WebSocket API,方便進一步客製化。
公司還允許用戶定義資料收集標準,例如與智能體對話的客戶姓名和電子郵件,並使用自然語言定義通話的成功與否評估標準。
ElevenLabs 正在利用其現有的文字轉語音管道,同時也為新對話式人工智慧產品開發語音轉文字功能。目前,該公司並未單獨提供語音轉文字API,但未來可能會推出,從而與Google、微軟和亞馬遜等公司的語音轉文字API 競爭,以及與OpenAI 的Whisper、AssemblyAI、Deepgram、Speechmatics 和Gladia 等專業API 展開競爭。
該公司計劃以超過30億美元的估值籌集新一輪資金,且正與其他語音AI 新創公司如Vapi 和Retell 展開競爭,這些公司同樣在建立對話智能體。更重要的是,ElevenLabs 將與OpenAI 的即時對話API 競爭。不過,ElevenLabs 相信其客製化能力和切換模型的靈活性,將使其在競爭中佔據優勢。
ElevenLabs 的這項新功能不僅增強了其在AI語音領域的競爭力,也為開發者提供了建構更強大、更個人化對話AI智能體的便利工具。未來,隨著語音轉文字功能的推出以及更多客製化選項的加入,ElevenLabs 有望在AI對話領域佔有一席之地。 Downcodes小編將持續關注其發展。