O Laboratório de IA de Xangai, a Escola de Ciência de Dados da Universidade Chinesa de Hong Kong e o Instituto de Pesquisa de Big Data de Shenzhen lançaram em conjunto um kit de ferramentas de geração de áudio, música e fala de código aberto chamado Amphion. Esta é uma notícia emocionante que fornecerá aos desenvolvedores em áreas relacionadas ao áudio ferramentas e recursos poderosos e promoverá o rápido desenvolvimento neste campo. Amphion inclui infraestrutura como processamento de dados, módulos gerais e algoritmos de otimização, e planeja integrar mais modelos de fala no futuro, com o objetivo de se tornar um dos melhores kits de ferramentas de fala de código aberto. Este é sem dúvida um recurso valioso para pesquisadores e desenvolvedores.
O Laboratório de IA de Xangai, a Escola de Ciência de Dados da Universidade Chinesa de Hong Kong e o Instituto de Pesquisa de Big Data de Shenzhen abriram em conjunto um kit de ferramentas de geração de áudio, música e fala chamado Amphion. Amphion pode ajudar os desenvolvedores a pesquisar áudio gerado por texto, música e outros campos relacionados ao áudio. O kit de ferramentas inclui infraestrutura como processamento de dados, módulos gerais e algoritmos de otimização, e planeja adicionar mais modelos relacionados à fala no futuro para criar um dos kits de ferramentas de fala de código aberto mais úteis.
O código aberto da Amphion promoverá o avanço da tecnologia de geração de áudio, música e fala, proporcionará conveniência a mais desenvolvedores e promoverá pesquisas e aplicações em áreas relacionadas. Acredito que o Amphion será mais utilizado no futuro e nos trará mais surpresas. Ansioso para seu futuro desenvolvimento e melhoria.