Play AI se complace en anunciar el lanzamiento de la versión Beta PlayDialog y Playnote, dos poderosas herramientas de IA que revolucionarán la forma en que se crea el contenido de audio. PlayDialog, un modelo de voz AI de extremo a extremo que genera audio de podcast conversacional con voz, emoción y tono natural y suave, superando a los principales competidores del mercado. PlayNote permite a los usuarios convertir rápidamente varios archivos multimedia en contenido de audio interesante y admite interfaces API para facilitar los desarrolladores generar contenido programático a gran escala. La combinación de estas dos herramientas ha traído eficiencia y conveniencia sin precedentes a la producción de podcast, doblaje de voz, aplicaciones comerciales y otros campos, abriendo una nueva era de diálogo humano-computadora.
Recientemente, Play AI lanzó oficialmente su producto más ambicioso, la versión PlayDialog Beta, que puede generar audio de podcast conversacional.
Este modelo de voz AI de extremo a extremo, que utiliza el contexto histórico del diálogo, puede regular la entonación, la emoción y la velocidad del habla para lograr una síntesis de habla más natural, marca una nueva altura para el diálogo humano-computadora. PlayDialog es particularmente adecuado para crear experiencias de conversación reales, como narración, doblaje de voz, podcasts sintéticos, etc., y también puede proporcionar una experiencia inmersiva de comunicación de voz uno a uno en un entorno empresarial, con el efecto similar al cuaderno de Google.
Al mismo tiempo, Play AI también ha lanzado PlayNote, una herramienta que puede convertir múltiples archivos multimedia (como PDF, texto, video, etc.) en experiencia en conversación. Los usuarios pueden generar podcasts, sesiones informativas, narraciones e incluso historias de niños en solo minutos y disfrutar de los efectos de voz suaves y naturales de PlayDialog. La característica única de PlayNote es que también proporciona una interfaz API, lo que permite a los usuarios implementar fácilmente la generación programática de contenido de audio sin depender de la interfaz de usuario.
Playdialog Beta ha sido entrenado en cientos de millones de conversaciones reales, y la escala del modelo es aproximadamente diez veces mayor que la del juego Ai3.0mini, y puede igualar el rendimiento de la voz humana en el tono (como los altibajos del habla y la velocidad). En las pruebas ciegas, PlayDialog Beta se desempeñó dos veces, así como el modelo competitivo líder en el mercado, especialmente con el puntaje más alto en expresividad.
A diferencia de los modelos de voz anteriores, PlayDialog Beta puede comprender el contexto de toda la conversación, lo que a su vez afecta el efecto de la generación de voz. Play AI construye una nueva arquitectura llamada "Dispositivo de cultivo de convergencia de voz adaptativa" (ASC), lo que permite que el modelo responda con un historial de diálogo completo, para que cada oración no sea una producción aislada, sino rica. Hace que el podcast sintético parezca hacer que el oyente sienta que el altavoz se comunica en el mismo espacio.
Ya sea que se trate de una discusión dinámica o un tema sensible que requiere empatía, PlayDialog puede adaptarse a la perfección, lo que hace que la interacción sea más natural y humana.
Los usuarios pueden experimentarlo todo con PlayNote, usándolo para crear narraciones potentes y naturales, podcasts, boletines y más, en solo unos minutos. Playnote también se puede usar a través de interfaces API, lo que permite a los desarrolladores generar contenido atractivo de manera programática a gran escala.
Entrada de tiya: https://play.ai/playnote
Introducción al blog oficial: https://blog.play.ai/blog/introducing-playdialog
Puntos clave:
PlayDialog Beta es una nueva generación de modelo de voz lanzado por Play AI, que puede simular más naturalmente las conversaciones humanas.
La herramienta PlayNote permite a los usuarios convertir rápidamente varios archivos multimedia en contenido de audio y admite interfaces API.
Playdialog Beta se desempeñó bien en las pruebas ciegas y obtuvo un puntaje alto tanto en fluidez en la generación del habla como en la expresión emocional.
Play's Playdialog y Playnote han revolucionado la creación de contenido de audio. Bienvenido al sitio web oficial para obtener más información.