20 января 2025 года приложение Doubao выпустило новейшую «сквозную» большую модель голосовой связи, внося серьезное обновление функции голосовых вызовов в реальном времени. Это обновление отмечает, что Doubao добился значительного прогресса в области голосового взаимодействия. Он больше не полагается на традиционные каскадные решения ASR, LLM и TTS, а интегрирует распознавание, понимание и генерацию речи в одну и ту же модель, обеспечивая более плавное и качественное взаимодействие. интеллектуальный опыт голосового взаимодействия. Целью этого обновления является улучшение антропоморфизма голосового взаимодействия, что позволит ИИ лучше понимать человеческие эмоции и реагировать на них.
20 января 2025 года приложение Doubao официально выпустило свою новейшую «сквозную» голосовую модель и внесло важные обновления в функцию голосовых вызовов в реальном времени. Этот прогресс знаменует собой еще один шаг вперед для Doubao в области голосового взаимодействия, превосходя предыдущие каскадные решения ASR (автоматическое распознавание речи), LLM (большая языковая модель) и TTS (Tensheng Audio), интегрирующие распознавание, понимание и генерацию речи. в той же модели.
После тестирования «Smart Emergence» самой большой особенностью новой версии Doubao является то, что она обладает человеческими способностями к выражению эмоций и эмоциональной отдаче, что улучшает беглость и уровень интеллекта в диалоге. В частности, режимы «соул-певец» и «различные знаменитости» позволяют Дубао не только петь, но и выполнять насыщенные ролевые игры, становясь новым фаворитом взаимодействия с пользователем. Например, когда пользователи попросили Дубао подражать голосу знаменитости Ю Шусиня, Дубао не только успешно воспроизвел тон персонажа, но и игриво выразил свою уникальную индивидуальность.
Еще больше стоит отметить то, что Дубао способен импровизировать песни в естественной беседе без необходимости сложных инструкций или профессиональных подсказок. Пользователи могут попросить Дубао спеть по своему желанию и даже указать тему текста. Хотя игра Дубао иногда допускала небольшие ошибки, скорость его реакции и способность к импровизации были потрясающими, демонстрируя его сильные антропоморфические способности.
Кроме того, два недавно добавленных индивидуальных режима Doubao, а именно «маленькая сумка» и «преувеличенный мастер», также приносят пользователям свежесть. Эти личностные особенности позволяют Дубао выражать разные эмоции и стили в разных ситуациях, тем самым делая общение более увлекательным и реалистичным.
Сегодня, с ростом развития технологий голосового взаимодействия, это обновление Doubao не только расширяет сценарии применения ИИ до таких областей, как эмоциональное общение и психологическое консультирование, но также делает возможности эмоционального общения ИИ ближе к людям. Эта трансформация, несомненно, позволит Doubao занять место на высококонкурентном рынке и возглавить будущее развитие взаимодействия ИИ.
Это обновление приложения Doubao не только обеспечивает прорыв в технологиях, но, что более важно, обеспечивает качественный скачок в пользовательском опыте, обеспечивая новое направление для будущего развития взаимодействия с искусственным интеллектом, и стоит ожидать новых инноваций в будущем.