Play AI는 최신 걸작인 대화형 팟캐스트 오디오를 생성할 수 있는 AI 음성 모델인 PlayDialog의 베타 버전을 출시합니다. 대화의 역사적 맥락에 따라 억양, 감정, 말하기 속도를 조정할 수 있을 뿐만 아니라 보다 자연스러운 음성 합성을 달성할 수 있을 뿐만 아니라 몰입형 음성 커뮤니케이션 경험을 창출할 수 있어 인간-컴퓨터 대화의 새로운 이정표라고 할 수 있습니다. 다운코드 편집자는 PlayDialog와 지원 도구인 PlayNote의 강력한 기능을 자세히 설명합니다.
최근 Play AI는 대화형 팟캐스트 오디오를 생성할 수 있는 가장 야심찬 제품인 PlayDialog 베타 버전을 공식 출시했습니다.
이 엔드 투 엔드 AI 음성 모델은 대화의 역사적 맥락을 사용하여 억양, 감정 및 음성 속도를 제어하여 보다 자연스러운 음성 합성을 달성함으로써 새로운 수준의 인간-기계 대화를 표시합니다. PlayDialog는 내레이션, 음성 더빙, 합성 팟캐스트 등과 같은 실제 대화 경험을 만드는 데 특히 적합합니다. 또한 Google의 NotebookLM과 유사하게 비즈니스 환경에서 몰입형 일대일 음성 커뮤니케이션 경험을 제공할 수도 있습니다.
동시에 Play AI는 다양한 미디어 파일(예: PDF, 텍스트, 비디오 등)을 대화 경험으로 변환할 수 있는 도구인 PlayNote도 출시했습니다. 사용자는 팟캐스트, 프리젠테이션, 내레이션은 물론 동화까지 몇 분 만에 생성할 수 있으며 PlayDialog가 제공하는 부드럽고 자연스러운 음성 효과를 즐길 수 있습니다. PlayNote의 독창성은 API 인터페이스도 제공하므로 사용자가 사용자 인터페이스에 의존하지 않고도 프로그래밍 방식으로 오디오 콘텐츠를 쉽게 생성할 수 있다는 것입니다.
PlayDialog 베타는 수억 건의 실제 대화에 대해 학습되었습니다. 모델 크기는 Play AI3.0mini의 약 10배이며, 억양(예: 음성의 억양 및 속도) 측면에서 인간의 음성 성능과 일치할 수 있습니다. 연설). 블라인드 테스트에서 PlayDialog 베타는 시장의 주요 경쟁 모델보다 두 배나 뛰어난 성능을 발휘했으며 특히 표현력 부문에서 최고 점수를 받았습니다.
이전 음성 모델과 달리 PlayDialog 베타는 전체 대화의 맥락을 이해할 수 있으므로 음성 생성 효과에 영향을 미칠 수 있습니다. Play AI는 ASC(Adaptive Speech Contextualizer)라는 새로운 아키텍처를 구축했습니다. 이를 통해 모델은 전체 대화 기록을 사용하여 응답할 수 있으므로 각 문장이 분리된 출력이 아니라 올바른 어조, 감정 및 풍부한 출력을 갖게 됩니다. 톤은 결과 팟캐스트를 듣는 사람이 화자와 같은 공간에서 소통하는 것처럼 느껴지게 만듭니다.
역동적인 토론이든 공감이 필요한 민감한 주제이든 PlayDialog는 원활하게 적응하여 상호 작용이 더욱 자연스럽고 인간적인 느낌을 줍니다.
사용자는 PlayNote를 통해 이 모든 것을 경험하고 단 몇 분 만에 강력하고 자연스러운 내레이션, 팟캐스트, 프레젠테이션 등을 만들 수 있습니다. PlayNote는 API 인터페이스를 통해서도 사용할 수 있으므로 개발자는 프로그래밍 방식으로 매력적인 콘텐츠를 대규모로 생성할 수 있습니다.
티아 입구 : https://play.ai/playnote
공식 블로그 소개: https://blog.play.ai/blog/introducing-playdialog
PlayDialog와 PlayNote의 등장은 의심할 여지없이 AI 음성 합성 기술을 새로운 차원으로 끌어올리고 팟캐스트 제작, 음성 커뮤니케이션 및 기타 분야에 혁신적인 변화를 가져올 것입니다. 앞으로도 Play AI의 더욱 놀라운 혁신을 기대하겠습니다!