Play AI 隆重推出最新力作-PlayDialog beta 版本,一款能夠產生對話式播客音訊的AI語音模型。它不僅能夠根據對話歷史脈絡調整語調、情感和語速,實現更自然的語音合成,更能創造出沉浸式的語音交流體驗,堪稱人機對話的新里程碑。 Downcodes小編將為您詳細解讀PlayDialog以及其配套工具PlayNote的強大功能。
近日,Play AI 正式推出最具野心的產品-PlayDialog beta版本,能產生對話式的播客音訊。
這款端到端的AI 語音模型,利用對話的歷史上下文,能夠調控語調、情緒和語速,以實現更自然的語音合成,標誌著人機對話的新高度。 PlayDialog 特別適合製作真實的對話體驗,例如旁白、語音配音、合成播客等,也能在商業環境中提供沉浸式的一對一語音交流體驗,效果類似谷歌的NotebookLM
同時,Play AI 也推出了PlayNote,這是一款可以將多種媒體檔案(如PDF、文字、影片等)轉化為對話體驗的工具。用戶可以在幾分鐘內產生播客、簡報、旁白,甚至是兒童故事,並享受到PlayDialog 所帶來的流暢、自然的語音效果。 PlayNote 的獨特之處在於,它也提供API 接口,使得用戶可以不依賴用戶界面,輕鬆實現音訊內容的程式化生成。
PlayDialog beta 經過數億次真實對話的訓練,模型規模約為Play AI3.0mini 的十倍,能夠在語調(如語音的抑揚頓挫、語速)上與人類的語音表現相匹配。在盲測中,PlayDialog beta 的表現比市場上領先的競爭模型高出兩倍,特別是在表達力方面得分最高。
不同於以往的語音模型,PlayDialog beta 可以理解整段對話的上下文,進而影響語音產生的效果。 Play AI建構了一種被稱為「自適應語音上下文化器」(ASC)的新架構,使得模型能夠利用完整的對話歷史進行回應,從而讓每一句話都不是孤立的輸出,而是豐富的具備合適的語調、情感和語氣,使得合成的播客彷彿讓聽眾感受到演講者在同一空間內進行交流。
無論是充滿活力的討論,還是需要同理心的敏感話題,PlayDialog 都能無縫適應,讓互動顯得更自然、更人性化。
使用者可以透過PlayNote 體驗這一切,並使用它來製作強而有力、自然的旁白、播客、簡報等,只需幾分鐘就能完成。 PlayNote 也可以透過API 介面使用,讓開發者以大規模程式化方式產生引人入勝的內容。
提亞點:https://play.ai/playnote
官方部落格介紹:https://blog.play.ai/blog/introducing-playdialog
PlayDialog與PlayNote的出現,無疑將推動AI語音合成技術邁向新的高度,為播客製作、語音交流等領域帶來革命性的改變。期待Play AI未來帶來更多令人驚喜的創新!