ElevenLabs lançou um novo recurso, GenFM, que permite aos usuários fazer upload de uma variedade de conteúdo, como vídeos, textos ou documentos do YouTube, e usar IA para gerar podcasts multicanais. Isso é semelhante ao NotebookLM do Google, mas o GenFM da ElevenLabs se concentra mais em adicionar elementos humanos ao áudio gerado por IA, como palavras de preenchimento como "um" e "ah", esforçando-se para encontrar um equilíbrio entre uma sensação natural de conversação e a praticidade. do conteúdo. Este recurso agora está disponível no aplicativo ElevenLabs Reader para iOS, com suporte para 32 idiomas, proporcionando aos usuários uma experiência de criação de podcast multilíngue mais conveniente.
A startup de inteligência artificial ElevenLabs lançou na quarta-feira um novo recurso chamado GenFM que permite aos usuários fazer upload de diferentes tipos de conteúdo para gerar podcasts multicanais, semelhante ao NotebookLM do Google.
Este recurso foi lançado no aplicativo ElevenLabs Reader para iOS e oferece suporte a 32 idiomas, incluindo inglês, hindi, português, chinês, espanhol, francês, alemão e japonês.
Ao usar o GenFM, os usuários podem primeiro enviar um vídeo, texto ou documento do YouTube, e o aplicativo seleciona automaticamente duas vozes para criar o podcast.
ElevenLabs oferece mais de uma dúzia de sons para os usuários escolherem. À medida que o aplicativo prepara o podcast gerado por IA, os usuários podem ver alguns prompts interessantes, como “Adicionar algumas pausas” e “Inserir algumas palavras de preenchimento”. Em um mundo onde muitas ferramentas ajudam as pessoas a eliminar os “ums” e “ahs”, a ElevenLabs optou por adicionar um toque humano aos seus podcasts gerados por IA.
“Discutimos o quanto introduzir sons de preenchimento ou sobreposição de conversação humana como 'um', 'ah', 'hum hum', risadas e respiração”, disse Jack McDermott, chefe de crescimento móvel da ElevenLabs, em uma entrevista. é encontrar o equilíbrio certo entre a conversa humana natural e a praticidade do conteúdo.”
Ele também ressalta que os melhores podcasts de formato longo tendem a ter menos distrações e um fluxo de conversação mais natural e profundo como experiência que eles buscam, com o objetivo de tornar a narração de histórias em áudio mais acessível em diferentes vozes e idiomas.
No futuro, a ElevenLabs planeja oferecer suporte a mais opções de personalização e permitir que os usuários adicionem várias fontes para criar podcasts generativos de IA. Em setembro, o Google lançou o recurso de conversação gerada por IA do NotebookLM e, um mês depois, adicionou a capacidade dos usuários de personalizar a saída do podcast.
No início deste mês, a ElevenLabs também anunciou que investiria 11 milhões de dólares no ecossistema de start-ups polaco e abriria um centro de investigação e desenvolvimento em Varsóvia para atrair talentos locais de IA. Enquanto isso, a empresa está se expandindo para a Índia, contratou um líder empresarial e está montando a equipe. Além disso, a ElevenLabs lançou agentes conversacionais de IA para clientes.
Destaque:
ElevenLabs lança função GenFM, que permite aos usuários enviar vídeos ou texto para gerar podcasts multicanais.
O recurso seleciona automaticamente duas vozes e adiciona palavras de preenchimento semelhantes às humanas para aprimorar a experiência natural de conversa.
A ElevenLabs planeja oferecer suporte a mais opções de personalização no futuro e expandir as operações na Polônia e na Índia.
Resumindo, a função GenFM do ElevenLabs fornece uma solução de IA conveniente e fácil de usar para produção de podcast, e vale a pena aguardar sua direção de desenvolvimento futuro. A agressiva estratégia de expansão global da empresa também anuncia as suas ambições no campo da inteligência artificial.