Play AI 激動地宣布推出PlayDialog beta 版本和PlayNote,這兩款強大的AI 工具將徹底改變音頻內容的創建方式。 PlayDialog,一個端到端的AI 語音模型,能夠生成具有自然流暢語音、情感和語調的對話式播客音頻,其表現力超越市場上領先的競品。而PlayNote 則允許用戶將各種媒體文件快速轉換為引人入勝的有聲內容,並支持API 接口,方便開發者進行大規模程序化內容生成。這兩款工具的結合,為播客製作、語音配音、商業應用等領域帶來了前所未有的效率和便捷性,開啟了人機對話的新紀元。
近日,Play AI 正式推出其最具雄心的產品——PlayDialog beta版本,能生成對話式的播客音頻。
這款端到端的AI 語音模型,利用對話的歷史上下文,能夠調控語調、情感和語速,以實現更自然的語音合成,標誌著人機對話的新高度。 PlayDialog 特別適合於製作真實的對話體驗,例如旁白、語音配音、合成播客等,也能在商業環境中提供沉浸式的一對一語音交流體驗,效果類似谷歌的NotebookLM
與此同時,Play AI 還推出了PlayNote,這是一款可以將多種媒體文件(如PDF、文本、視頻等)轉化為對話體驗的工具。用戶可以在幾分鐘內生成播客、簡報、旁白,甚至是兒童故事,並享受到PlayDialog 所帶來的流暢、自然的語音效果。 PlayNote 的獨特之處在於,它也提供API 接口,使得用戶可以不依賴用戶界面,輕鬆實現音頻內容的程序化生成。
PlayDialog beta 經過數億次真實對話的訓練,模型規模約為Play AI3.0mini 的十倍,能夠在語調(如語音的抑揚頓挫、語速)上與人類的語音表現相匹配。在盲測中,PlayDialog beta 的表現比市場上領先的競爭模型高出兩倍,特別是在表達力方面得分最高。
不同於以往的語音模型,PlayDialog beta 可以理解整段對話的上下文,進而影響語音生成的效果。 Play AI構建了一種被稱為“自適應語音上下文化器”(ASC)的新架構,使得模型能夠利用完整的對話歷史進行回應,從而讓每一句話都不是孤立的輸出,而是豐富的具備合適的語調、情感和語氣,使得合成的播客彷彿讓聽眾感受到演講者在同一空間內進行交流。
無論是充滿活力的討論,還是需要同理心的敏感話題,PlayDialog 都能無縫適應,讓互動顯得更加自然和人性化。
用戶可以通過PlayNote 體驗這一切,使用它製作強有力、自然的旁白、播客、簡報等,只需幾分鐘就能完成。 PlayNote 也可以通過API 接口使用,允許開發者以大規模程序化方式生成引人入勝的內容。
提亞入口:https://play.ai/playnote
官方博客介紹:https://blog.play.ai/blog/introducing-playdialog
劃重點:
PlayDialog beta 是Play AI 推出的新一代語音模型,能夠更自然地模擬人類對話。
PlayNote 工具使用戶能夠快速將各種媒體文件轉化為有聲內容,並支持API 接口。
PlayDialog beta 在盲測中表現出色,語音生成的流暢性和情感表達均獲得高分。
Play AI 的PlayDialog 和PlayNote 為音頻內容創作帶來了革命性的變化,其強大的功能和便捷的操作將賦能更多創作者,並為用戶帶來更沉浸式的音頻體驗。 歡迎訪問官方網站了解更多信息。