Hume AI объявил о своей революционной функции голосового управления, которая является экспериментальной функцией, которая позволяет пользователям создавать высоко персонализированный голос искусственного интеллекта без каких -либо кодировки или профессиональных навыков. Эта функция основана на Hume Empate Voice Interface 2 (EVI2), что еще больше повышает естественность, эмоциональное выражение и настройку голоса, предоставляя разработчикам и пользователям беспрецедентный уровень управления, тем самым создавая встречу, которая отвечает различным потребностям применения уникальных звуков, таких Как роботы по обслуживанию клиентов, цифровые помощники, инструменты образования и т. Д. Ожидается, что эта инновационная технология полностью изменит индустрию Voice AI и предоставит пользователям более интимный и более индивидуальный опыт голоса.
Хьюм Ай, стартап, специализирующийся на эмоциональном интеллектуальном интерфейсе голоса, недавно запустил экспериментальную функцию под названием «Голосовое управление».
Этот новый инструмент предназначен для того, чтобы помочь разработчикам и пользователям создавать персонализированные звуки искусственного интеллекта без каких -либо кодировки, инженерного инженера ИИ или навыков звука. Пользователи могут легко настраивать звуки, которые отвечают потребностям, точно настраивая характеристики звука.
Эта новая функция основана на предыдущем «Конвергентном голосовом интерфейсе 2» (EVI2), EVI2 повышает естественную природу, способность эмоционального отклика и настройку голоса. В отличие от традиционной технологии голосового клонирования, продукты Hume фокусируются на предоставлении уникальных и выразительных звуков для удовлетворения потребностей роботов по обслуживанию клиентов, цифровых помощников, учителей, гидов и без барьеров.
Функция голосового управления позволяет разработчикам регулировать характеристики звука на десять различных измерений, включая пол, решительность, волнение и уверенность в себе.
«Мужчины/женщины: Гендерно, диапазон между более мужским и более женским.
Самостоятельность: твердость звука между робкой и жирным жирником.
Плавушка: плотность звука находится между дефляцией и плавучестью.
Доверие: степень определения звука находится между застенчивостью и уверенностью.
Страсть: волнение в звуке - между миром и энтузиазмом.
Носовой звук: открытость звука находится между чистыми и носовыми звуками.
Расслабьтесь: давление в звуке находится между напряжением и расслаблением.
Гладкий: текстура звука находится между гладкой и отключенной.
Мягкая: жизненная сила за звуком находится между мягкой и мощной.
Тяжесть: терпимость звука находится в стесненности и астме. "
Пользователи могут исправить эти атрибуты в режиме реального времени через виртуальные ползунки, чтобы сделать настройку простой и ясной. Эта функция в настоящее время предоставляется на виртуальной платформе Юма, и пользователи могут получить к ней доступ для бесплатной регистрации.
Голосовое управление теперь запустило тестовую версию и интегрировано с эмпатическим голосовым интерфейсом Юма (EVI), чтобы она использовалась для обширных приложений. Разработчики могут выбрать основной голос, регулировать свои характеристики и предварительно просмотреть результаты в режиме реального времени. Этот процесс может обеспечить повторение и стабильность между сессиями.
Влияние EVI2 очевидно с точки зрения функции голосового управления. Ранние модели представили такие функции, как подсказка для диалога и функции мульти -языка, которые расширяют объем приложений Voice AI. Например, EVI2 поддерживает время отклика под -второго для достижения естественного и мгновенного диалога. Это также позволяет динамически настраивать стиль разговора во время взаимодействия, что делает его многофункциональным инструментом для предприятия.
Это именно для решения проблемы предустановленных звуков в индустрии искусственного интеллекта, многие бренды или приложения часто трудно найти звуки, которые отвечают их потребностям. Цель Хьюма состоит в том, чтобы развить эмоциональный и деликатный AI Voice AI для продвижения прогресса в отрасли. Когда EVI2 был выпущен в сентябре 2024 года, EVI2 значительно улучшил задержки и выгоды от голоса и обеспечивает безопасную альтернативу функции регулировки голоса.
Метод, управляемый исследованиями Юма, занимает основную позицию в разработке продукта, объединяя кросс -культурные звуковые данные и данные эмоционального обследования. Эта методология является основой EVI2 и недавно запущенного голосового контроля, что позволяет ему тщательно запечатлеть человеческое восприятие человеческих звуков.
В настоящее время в тестовой версии было запущено голосовое управление и в сочетании с голосовым интерфейсом Hume Empathy (EVI) для поддержки различных сценариев приложений. Разработчики могут выбрать основные звуки, регулировать свои характеристики и предварительно просмотреть результаты в режиме реального времени, чтобы обеспечить согласованность и стабильность в реальных приложениях, таких как обслуживание клиентов или виртуальные помощники.
С интенсификацией конкуренции на рынке персонализированный голос Юма и эмоциональное интеллектуальное позиционирование делают его выделенным в области Voice AI. В будущем Хьюм планирует расширить функцию голосового управления, увеличить регулирующие регулируемые размеры, оптимизировать качество звука и увеличить объем выбора основных звуков.
Официальный блог: https://www.hume.ai/blog/introducing-voice-control
Очки:
** Hume AI запустил функцию «голосовое управление», и пользователи могут легко создавать персонализированные звуки искусственного интеллекта. **
** Эта функция не должна кодировать навыки, пользователи могут регулировать характеристики звука через слайдер. **
** Юм стремится удовлетворить различные потребности применения с помощью ИИ персонализированного и эмоционального интеллекта. **
В целом, функция «Голосового управления» Юма Ай привносит новые возможности для области настройки голоса искусственного интеллекта. В будущем, с постоянным улучшением и расширением функций, HUME AI, как ожидается, станет лидерами в области AI.