ElevenLabs 推出了新功能GenFM,這項功能讓用戶能夠上傳各種內容,例如YouTube 影片、文字或文檔,並利用AI 產生多聲道播客。這與Google的NotebookLM 類似,但ElevenLabs 的GenFM 更專注於在AI 生成音訊中加入人性化的元素,例如「嗯」、「啊」等填充詞,力求在自然對話感和內容實用性之間取得平衡。該功能現已在ElevenLabs Reader 的iOS 應用程式中上線,支援32 種語言,為用戶提供了更便利的多語言播客創作體驗。
人工智慧新創公司ElevenLabs 於週三推出了一項新功能,名為GenFM,該功能允許用戶上傳不同類型的內容以產生多聲道播客,類似於Google的NotebookLM。
這項功能已在ElevenLabs Reader 的iOS 應用程式中上線,支援32種語言,包括英語、印地語、葡萄牙語、中文、西班牙語、法語、德語和日語等。
使用GenFM 時,使用者可以先上傳YouTube 影片、文字或文檔,應用程式會自動選擇兩個聲音來建立播客。
ElevenLabs 提供了十多種聲音供使用者選擇。應用程式在準備AI 產生的播客時,使用者可能會看到一些有趣的提示,例如「添加一些停頓」 和「插入一些填充詞」。在當前許多工具幫助人們去除「嗯」 和「啊」 的背景下,ElevenLabs 卻選擇為其AI 生成的播客添加一些人性化的元素。
ElevenLabs 的行動成長負責人Jack McDermott 在接受採訪時表示:「我們討論了在多大程度上引入'嗯'、'啊'、'嗯哼'、笑聲和呼吸等類似人類對話的填充詞或覆蓋聲音。
他還指出,優秀的長格式播客中往往幹擾較少,更自然、更深入的對話流是他們追求的體驗,旨在使音頻敘事在不同聲音和語言中更易於訪問。
未來,ElevenLabs 計畫支援更多的自訂選項,並允許用戶添加多個來源來建立生成式AI 播客。 9月份,Google推出了NotebookLM 的AI 生成對話功能,並在一個月後新增了使用者自訂播客輸出的能力。
本月初,ElevenLabs 也宣布將投資1,100萬美元到波蘭新創企業生態系統,並在華沙開設研發中心,以吸引當地AI 人才。同時,該公司正在擴展到印度,已招募了一名業務負責人並正在組建團隊。此外,ElevenLabs 也為客戶推出了對話AI 代理程式。
劃重點:
ElevenLabs 推出GenFM 功能,支援用戶上傳影片或文字產生多聲道播客。
此功能自動選擇兩種聲音,並添加人性化的填充詞以增強自然對話體驗。
ElevenLabs 計畫未來支援更多自訂選項,並在波蘭和印度擴展業務。
總而言之,ElevenLabs 的GenFM 功能為播客製作提供了便利且人性化的AI解決方案,其未來的發展方向也值得期待。 公司積極的全球擴張策略也預示著其在人工智慧領域的雄心壯志。