ElevenLabs ha lanzado una nueva función, GenFM, que permite a los usuarios subir una variedad de contenidos, como vídeos, textos o documentos de YouTube, y utilizar IA para generar podcasts multicanal. Esto es similar a NotebookLM de Google, pero GenFM de ElevenLabs se centra más en agregar elementos humanos al audio generado por IA, como palabras de relleno como "um" y "ah", esforzándose por lograr un equilibrio entre una sensación de conversación natural y la practicidad. del contenido. Esta función ahora está disponible en la aplicación ElevenLabs Reader para iOS y admite 32 idiomas, lo que brinda a los usuarios una experiencia de creación de podcasts multilingüe más conveniente.
La startup de inteligencia artificial ElevenLabs lanzó el miércoles una nueva función llamada GenFM que permite a los usuarios cargar diferentes tipos de contenido para generar podcasts multicanal, similar a NotebookLM de Google.
Esta función se lanzó en la aplicación ElevenLabs Reader para iOS y admite 32 idiomas, incluidos inglés, hindi, portugués, chino, español, francés, alemán y japonés.
Al usar GenFM, los usuarios pueden primero cargar un video, texto o documento de YouTube, y la aplicación selecciona automáticamente dos voces para crear el podcast.
ElevenLabs ofrece más de una docena de sonidos para que los usuarios elijan. Mientras la aplicación prepara el podcast generado por IA, los usuarios pueden ver algunas indicaciones interesantes, como "Agregar algunas pausas" e "Insertar algunas palabras de relleno". En un mundo donde muchas herramientas ayudan a las personas a eliminar los "ums" y los "ahs", ElevenLabs ha optado por añadir un toque humano a sus podcasts generados por IA.
"Discutimos cuánto introducir sonidos de relleno o superposición de conversaciones humanas como 'um', 'ah', 'um hum', risas y respiración", dijo Jack McDermott, jefe de crecimiento móvil de ElevenLabs, en una entrevista. es encontrar el equilibrio adecuado entre la conversación humana natural y la practicidad del contenido”.
También señala que los mejores podcasts de larga duración tienden a tener menos distracciones y un flujo conversacional más natural y profundo como experiencia por la que se esfuerzan, con el objetivo de hacer que la narración en audio sea más accesible en diferentes voces e idiomas.
En el futuro, ElevenLabs planea admitir más opciones de personalización y permitir a los usuarios agregar múltiples fuentes para crear podcasts generativos de IA. En septiembre, Google lanzó la función de conversación generada por IA de NotebookLM y un mes después agregó la capacidad para que los usuarios personalicen la salida del podcast.
A principios de este mes, ElevenLabs también anunció que invertiría 11 millones de dólares en el ecosistema de startups polaco y abriría un centro de investigación y desarrollo en Varsovia para atraer talentos locales en IA. Mientras tanto, la empresa se está expandiendo a la India, ha contratado a un líder empresarial y está formando el equipo. Además, ElevenLabs ha lanzado agentes de IA conversacionales para los clientes.
Destacar:
ElevenLabs lanza la función GenFM, que permite a los usuarios subir vídeos o texto para generar podcasts multicanal.
La función selecciona automáticamente dos voces y agrega palabras de relleno similares a las humanas para mejorar la experiencia de conversación natural.
ElevenLabs planea admitir más opciones de personalización en el futuro y expandir sus operaciones en Polonia e India.
Con todo, la función GenFM de ElevenLabs proporciona una solución de inteligencia artificial conveniente y fácil de usar para la producción de podcasts, y vale la pena esperar con ansias su dirección de desarrollo futuro. La agresiva estrategia de expansión global de la empresa también presagia sus ambiciones en el campo de la inteligencia artificial.