Шанхайская лаборатория искусственного интеллекта, Школа обработки данных Китайского университета Гонконга и Шэньчжэньский научно-исследовательский институт больших данных совместно выпустили набор инструментов для генерации аудио, музыки и речи с открытым исходным кодом под названием Amphion. Это потрясающая новость, которая предоставит разработчикам в областях, связанных с аудио, мощные инструменты и ресурсы и будет способствовать быстрому развитию этой области. Amphion включает в себя такую инфраструктуру, как обработка данных, общие модули и алгоритмы оптимизации, и планирует в будущем интегрировать больше речевых моделей, стремясь стать одним из лучших наборов речевых инструментов с открытым исходным кодом. Это, несомненно, ценный ресурс для исследователей и разработчиков.
Шанхайская лаборатория искусственного интеллекта, Школа наук о данных Китайского университета Гонконга и Шэньчжэньский научно-исследовательский институт больших данных совместно открыли исходный код набора инструментов для генерации аудио, музыки и речи под названием Amphion. Amphion может помочь разработчикам исследовать текстовое аудио, музыку и другие области, связанные со звуком. Набор инструментов включает в себя такую инфраструктуру, как обработка данных, общие модули и алгоритмы оптимизации, и в будущем планируется добавить больше моделей, связанных с речью, чтобы создать один из наиболее полезных наборов инструментов для работы с речью с открытым исходным кодом.
Открытый исходный код Amphion будет способствовать развитию технологий генерации звука, музыки и речи, обеспечит удобство для большего числа разработчиков и будет способствовать исследованиям и приложениям в смежных областях. Я верю, что Amphion будет более широко использоваться в будущем и преподнесет нам больше сюрпризов. С нетерпением ждем его дальнейшего развития и совершенствования.