ElevenLabs запустила новую функцию GenFM, которая позволяет пользователям загружать различный контент, например видео, текст или документы на YouTube, а также использовать искусственный интеллект для создания многоканальных подкастов. Это похоже на NotebookLM от Google, но GenFM от ElevenLabs больше фокусируется на добавлении человеческих элементов в звук, генерируемый искусственным интеллектом, таких как слова-вставки, такие как «гм» и «ах», стремясь найти баланс между естественным ощущением разговора и практичностью. содержания. Эта функция теперь доступна в приложении ElevenLabs Reader для iOS, поддерживающем 32 языка, предоставляя пользователям более удобный опыт создания многоязычных подкастов.
Стартап в области искусственного интеллекта ElevenLabs в среду запустил новую функцию под названием GenFM, которая позволяет пользователям загружать различные типы контента для создания многоканальных подкастов, аналогично Google NotebookLM.
Эта функция была запущена в приложении ElevenLabs Reader для iOS и поддерживает 32 языка, включая английский, хинди, португальский, китайский, испанский, французский, немецкий и японский.
При использовании GenFM пользователи могут сначала загрузить видео, текст или документ на YouTube, и приложение автоматически выбирает два голоса для создания подкаста.
ElevenLabs предлагает пользователям на выбор более десятка звуков. Пока приложение готовит подкаст, созданный искусственным интеллектом, пользователи могут увидеть некоторые интересные подсказки, такие как «Добавьте паузы» и «Вставьте несколько слов-вставок». В мире, где множество инструментов помогают людям избавиться от «хм» и «ах», ElevenLabs решила добавить человечность в свои подкасты, создаваемые искусственным интеллектом.
«Мы обсуждали, насколько нужно вводить человеческие разговорные наполнители или наложения звуков, таких как «хм», «ах», «хм», смех и дыхание», — сказал в интервью Наша цель Джек МакДермотт, руководитель отдела развития мобильных устройств в ElevenLabs. заключается в том, чтобы найти правильный баланс между естественным человеческим разговором и практичностью содержания».
Он также отмечает, что лучшие длинные подкасты, как правило, содержат меньше отвлекающих факторов и более естественный и глубокий разговорный поток как опыт, к которому они стремятся, стремясь сделать аудиорассказывание более доступным для разных голосов и языков.
В будущем ElevenLabs планирует поддерживать больше возможностей настройки и позволить пользователям добавлять несколько источников для создания подкастов с генеративным искусственным интеллектом. В сентябре Google запустил в NotebookLM функцию разговоров, генерируемую искусственным интеллектом, а месяц спустя добавил для пользователей возможность настраивать вывод подкастов.
Ранее в этом месяце ElevenLabs также объявила, что инвестирует 11 миллионов долларов США в польскую экосистему стартапов и откроет центр исследований и разработок в Варшаве для привлечения местных талантов в области искусственного интеллекта. Тем временем компания расширяется в Индию, наняла бизнес-лидера и формирует команду. Кроме того, ElevenLabs запустила для клиентов диалоговые агенты искусственного интеллекта.
Выделять:
ElevenLabs запускает функцию GenFM, которая позволяет пользователям загружать видео или текст для создания многоканальных подкастов.
Эта функция автоматически выбирает два голоса и добавляет человеческие слова-вставки, чтобы сделать разговор более естественным.
ElevenLabs планирует поддерживать больше возможностей настройки в будущем и расширять свою деятельность в Польше и Индии.
В целом, функция GenFM от ElevenLabs представляет собой удобное и дружелюбное к пользователю решение на основе искусственного интеллекта для производства подкастов, и стоит с нетерпением ждать ее будущего развития. Агрессивная стратегия глобального расширения компании также свидетельствует о ее амбициях в области искусственного интеллекта.