Play AI 激动地宣布推出 PlayDialog beta 版本和 PlayNote,这两款强大的 AI 工具将彻底改变音频内容的创建方式。PlayDialog,一个端到端的 AI 语音模型,能够生成具有自然流畅语音、情感和语调的对话式播客音频,其表现力超越市场上领先的竞品。而 PlayNote 则允许用户将各种媒体文件快速转换为引人入胜的有声内容,并支持 API 接口,方便开发者进行大规模程序化内容生成。这两款工具的结合,为播客制作、语音配音、商业应用等领域带来了前所未有的效率和便捷性,开启了人机对话的新纪元。
近日,Play AI 正式推出其最具雄心的产品 ——PlayDialog beta版本,能生成对话式的播客音频。
这款端到端的 AI 语音模型,利用对话的历史上下文,能够调控语调、情感和语速,以实现更自然的语音合成,标志着人机对话的新高度。PlayDialog 特别适合于制作真实的对话体验,例如旁白、语音配音、合成播客等,也能在商业环境中提供沉浸式的一对一语音交流体验,效果类似谷歌的NotebookLM
与此同时,Play AI 还推出了 PlayNote,这是一款可以将多种媒体文件(如 PDF、文本、视频等)转化为对话体验的工具。用户可以在几分钟内生成播客、简报、旁白,甚至是儿童故事,并享受到 PlayDialog 所带来的流畅、自然的语音效果。PlayNote 的独特之处在于,它也提供 API 接口,使得用户可以不依赖用户界面,轻松实现音频内容的程序化生成。
PlayDialog beta 经过数亿次真实对话的训练,模型规模约为 Play AI3.0mini 的十倍,能够在语调(如语音的抑扬顿挫、语速)上与人类的语音表现相匹配。在盲测中,PlayDialog beta 的表现比市场上领先的竞争模型高出两倍,特别是在表达力方面得分最高。
不同于以往的语音模型,PlayDialog beta 可以理解整段对话的上下文,进而影响语音生成的效果。Play AI构建了一种被称为 “自适应语音上下文化器”(ASC)的新架构,使得模型能够利用完整的对话历史进行回应,从而让每一句话都不是孤立的输出,而是丰富的具备合适的语调、情感和语气,使得合成的播客仿佛让听众感受到演讲者在同一空间内进行交流。
无论是充满活力的讨论,还是需要同理心的敏感话题,PlayDialog 都能无缝适应,让互动显得更加自然和人性化。
用户可以通过 PlayNote 体验这一切,使用它制作强有力、自然的旁白、播客、简报等,只需几分钟就能完成。PlayNote 也可以通过 API 接口使用,允许开发者以大规模程序化方式生成引人入胜的内容。
提亚入口:https://play.ai/playnote
官方博客介绍:https://blog.play.ai/blog/introducing-playdialog
划重点:
PlayDialog beta 是 Play AI 推出的新一代语音模型,能够更自然地模拟人类对话。
PlayNote 工具使用户能够快速将各种媒体文件转化为有声内容,并支持 API 接口。
PlayDialog beta 在盲测中表现出色,语音生成的流畅性和情感表达均获得高分。
Play AI 的 PlayDialog 和 PlayNote 为音频内容创作带来了革命性的变化,其强大的功能和便捷的操作将赋能更多创作者,并为用户带来更沉浸式的音频体验。 欢迎访问官方网站了解更多信息。