Недавно исследователи из Университета Фудань совершили крупный прорыв и успешно запустили новую речевую крупномасштабную языковую модель SpeechGPT-Gen. Модель имеет размер параметров 8 миллиардов и обладает отличными характеристиками в области преобразования текста в речь, преобразования речи и голосового диалога. Ее высокая эффективность обусловлена инновационным методом генерации информационной цепочки. Это исследование устанавливает новую веху в развитии технологии голосового искусственного интеллекта и обеспечивает надежную техническую поддержку для более интеллектуальных приложений в будущем.
Webmaster Home сообщил, что исследователи из Университета Фудань запустили SpeechGPT-Gen, крупномасштабную языковую модель речи с 8B параметрами, обладающую высокой эффективностью в моделировании семантической и перцептивной информации. Модель демонстрирует отличную производительность и масштабируемость в различных приложениях, таких как преобразование текста в речь, преобразование речи и голосовой диалог. Метод цепочки генерации информации (CoIG) принят для решения проблемы неэффективности традиционных методов генерации речи. Кроме того, модель априори использует семантическую информацию при сопоставлении потоков, что повышает эффективность и качество выходных данных модели.
Появление модели SpeechGPT-Gen знаменует собой значительный прогресс в технологии искусственного интеллекта речи. Его высокая эффективность и масштабируемость открывают возможности для большего количества сценариев применения в будущем. Я считаю, что в будущем появятся еще более удивительные результаты исследований.