Hume AI объявила о запуске своей экспериментальной функции «Голосовое управление», инновационной функции, которая позволяет пользователям легко настраивать персонализированные голоса ИИ без какого-либо программирования или знаний в области ИИ. С помощью интуитивно понятных виртуальных ползунков пользователи могут точно настроить десять различных параметров голосовых характеристик, таких как пол, уверенность, энтузиазм и т. д., чтобы создать уникальный голос, подходящий для различных сценариев применения. Эта функция основана на ранее выпущенном Hume «Empathic Voice Interface 2» (EVI2), что еще больше улучшает естественность, эмоциональное выражение и настраиваемость речи.
Hume AI, стартап, специализирующийся на эмоционально интеллектуальных голосовых интерфейсах, недавно запустил экспериментальную функцию под названием «голосовое управление».
Этот новый инструмент предназначен для того, чтобы помочь разработчикам и пользователям создавать персонализированные звуки искусственного интеллекта без каких-либо навыков кодирования, подсказок искусственного интеллекта или звукового дизайна. Пользователи могут легко настроить звук в соответствии со своими потребностями, точно настроив звуковые характеристики.
Эта новая функция основана на ранее выпущенном компанией Empathic Voice Interface 2 (EVI2), который повышает естественность, эмоциональную отзывчивость и возможность настройки речи. В отличие от традиционной технологии клонирования голоса, продукты Hume ориентированы на предоставление уникальных и выразительных голосов для удовлетворения потребностей различных приложений, включая чат-ботов службы поддержки клиентов, цифровых помощников, учителей, гидов и функций специальных возможностей.
Голосовое управление позволяет разработчикам настраивать характеристики голоса по десяти различным параметрам, включая пол, напористость, волнение, уверенность и многое другое.
«Мужчина/женщина: гендерные вокализации, которые варьируются от более мужских до более женственных.
Уверенность: твердость голоса, между робостью и смелостью.
Плавучесть: Плотность звука, варьирующаяся от дефляции до плавучести.
Уверенность: Степень уверенности в голосе, между застенчивостью и уверенностью.
Энтузиазм: Волнение в голосе, что-то среднее между спокойствием и энтузиазмом.
Гнусавость: открытость голоса, варьирующаяся от ясного до гнусавого.
Релаксация: давление в голосе, между напряжением и расслаблением.
Плавность: текстура звука, что-то среднее между плавностью и отрывистым звуком.
Мягкость: Энергия звука, что-то среднее между нежным и мощным.
Плотность: насколько сдержан звук, от плотного до запыхавшегося. "
Пользователи могут точно настраивать эти свойства в режиме реального времени с помощью виртуальных ползунков, что делает настройку простой и понятной. Эта функция в настоящее время доступна на виртуальной платформе Хьюма, и пользователи могут получить к ней доступ, просто зарегистрировавшись бесплатно.
Голосовое управление в настоящее время доступно в бета-версии и интегрируется с эмпатическим голосовым интерфейсом Hume (EVI), что делает его доступным для широкого спектра приложений. Разработчики могут выбрать базовый голос, настроить его характеристики и просмотреть результаты в реальном времени. Этот процесс обеспечивает повторяемость и стабильность от сеанса к сеансу, что является ключевой особенностью приложений реального времени, таких как боты обслуживания клиентов или виртуальные помощники.
Влияние EVI2 очевидно в функциях голосового управления. В ранних моделях были представлены такие функции, как диалоговые подсказки и многоязычные возможности, которые расширили сферу применения голосовых приложений искусственного интеллекта. Например, EVI2 поддерживает время отклика менее секунды для естественного, мгновенного разговора. Он также позволяет динамически корректировать стили разговора во время взаимодействия, что делает его универсальным инструментом для бизнеса.
Этот шаг призван решить проблему зависимости от предустановленных звуков в индустрии искусственного интеллекта. Многие бренды или приложения часто испытывают трудности с поиском звуков, соответствующих их потребностям. Цель Хьюма — разработать эмоционально чувствительный голосовой ИИ и способствовать прогрессу отрасли. Когда EVI2 будет выпущен в сентябре 2024 года, он уже значительно улучшит задержку и экономичность голосовой связи, а также предоставит безопасную альтернативу функциям настройки голоса.
В основе разработки продуктов лежит исследовательский подход Хьюма, сочетающий межкультурные голосовые записи и данные эмоциональных опросов. Эта методология лежит в основе EVI2 и недавно выпущенной системы голосового управления, позволяющей улавливать восприятие звука человеком в мельчайших деталях.
В настоящее время голосовое управление запущено в бета-версии и объединено с эмпатическим голосовым интерфейсом Hume (EVI) для поддержки различных сценариев применения. Разработчики могут выбирать базовый звук, настраивать его характеристики и просматривать результаты в реальном времени, обеспечивая согласованность и стабильность в приложениях реального времени, таких как служба поддержки клиентов или виртуальные помощники.
Поскольку конкуренция на рынке усиливается, персонализированный голос Хьюма и позиционирование эмоционального интеллекта выделяют его среди голосового искусственного интеллекта. В будущем Хьюм планирует расширить функции голосового управления, добавить регулируемые размеры, оптимизировать качество звука и увеличить выбор основных звуков.
Официальный блог: https://www.hume.ai/blog/introducing-voice-control.
Основные моменты:
? **Hume AI запустил функцию «голосового управления», позволяющую пользователям легко создавать персонализированные голоса ИИ. **
?️ ** Эта функция не требует навыков программирования, и пользователи могут регулировать характеристики звука с помощью ползунков. **
? **Hume разработан для удовлетворения разнообразных потребностей приложений с помощью персонализированного и эмоционально интеллектуального голосового искусственного интеллекта. **
В целом, функция «голосового управления» Hume AI обеспечивает беспрецедентное удобство настройки голоса ИИ. Его функции персонализации и эмоционального интеллекта значительно расширят применение голоса ИИ в различных областях. Стоит с нетерпением ждать его дальнейшего развития и обновления функций. .