Play AI 隆重推出其最新力作——PlayDialog beta 版本,一款能够生成对话式播客音频的AI语音模型。它不仅能够根据对话历史上下文调整语调、情感和语速,实现更自然的语音合成,更能创造出沉浸式的语音交流体验,堪称人机对话的新里程碑。Downcodes小编将为您详细解读PlayDialog以及其配套工具PlayNote的强大功能。
近日,Play AI 正式推出其最具雄心的产品 ——PlayDialog beta版本,能生成对话式的播客音频。
这款端到端的 AI 语音模型,利用对话的历史上下文,能够调控语调、情感和语速,以实现更自然的语音合成,标志着人机对话的新高度。PlayDialog 特别适合于制作真实的对话体验,例如旁白、语音配音、合成播客等,也能在商业环境中提供沉浸式的一对一语音交流体验,效果类似谷歌的NotebookLM
与此同时,Play AI 还推出了 PlayNote,这是一款可以将多种媒体文件(如 PDF、文本、视频等)转化为对话体验的工具。用户可以在几分钟内生成播客、简报、旁白,甚至是儿童故事,并享受到 PlayDialog 所带来的流畅、自然的语音效果。PlayNote 的独特之处在于,它也提供 API 接口,使得用户可以不依赖用户界面,轻松实现音频内容的程序化生成。
PlayDialog beta 经过数亿次真实对话的训练,模型规模约为 Play AI3.0mini 的十倍,能够在语调(如语音的抑扬顿挫、语速)上与人类的语音表现相匹配。在盲测中,PlayDialog beta 的表现比市场上领先的竞争模型高出两倍,特别是在表达力方面得分最高。
不同于以往的语音模型,PlayDialog beta 可以理解整段对话的上下文,进而影响语音生成的效果。Play AI构建了一种被称为 “自适应语音上下文化器”(ASC)的新架构,使得模型能够利用完整的对话历史进行回应,从而让每一句话都不是孤立的输出,而是丰富的具备合适的语调、情感和语气,使得合成的播客仿佛让听众感受到演讲者在同一空间内进行交流。
无论是充满活力的讨论,还是需要同理心的敏感话题,PlayDialog 都能无缝适应,让互动显得更加自然和人性化。
用户可以通过 PlayNote 体验这一切,使用它制作强有力、自然的旁白、播客、简报等,只需几分钟就能完成。PlayNote 也可以通过 API 接口使用,允许开发者以大规模程序化方式生成引人入胜的内容。
提亚入口:https://play.ai/playnote
官方博客介绍:https://blog.play.ai/blog/introducing-playdialog
PlayDialog和PlayNote的出现,无疑将推动AI语音合成技术迈向新的高度,为播客制作、语音交流等领域带来革命性的变化。期待Play AI未来带来更多令人惊喜的创新!