Código abierto como el Laboratorio de IA de Shanghai y el kit de herramientas de desarrollo unificado de audio y música Amphion

Autor：Eve Cole Fecha de actualización：2025-01-23 19:00:03

El Laboratorio de IA de Shanghai, la Escuela de Ciencia de Datos de la Universidad China de Hong Kong y el Instituto de Investigación de Big Data de Shenzhen lanzaron conjuntamente un conjunto de herramientas de generación de voz, música y audio de código abierto llamado Amphion. Esta es una noticia emocionante que proporcionará a los desarrolladores en campos relacionados con el audio herramientas y recursos poderosos y promoverá el rápido desarrollo de este campo. Amphion incluye infraestructura como procesamiento de datos, módulos generales y algoritmos de optimización, y planea integrar más modelos de voz en el futuro, con el objetivo de convertirse en uno de los mejores conjuntos de herramientas de voz de código abierto. Este es sin duda un recurso valioso para investigadores y desarrolladores.

El Laboratorio de IA de Shanghai, la Escuela de Ciencia de Datos de la Universidad China de Hong Kong y el Instituto de Investigación de Big Data de Shenzhen abrieron conjuntamente un conjunto de herramientas de generación de audio, música y voz llamado Amphion. Amphion puede ayudar a los desarrolladores a investigar audio generado por texto, música y otros campos relacionados con el audio. El conjunto de herramientas incluye infraestructura como procesamiento de datos, módulos generales y algoritmos de optimización, y planea agregar más modelos relacionados con el habla en el futuro para crear uno de los conjuntos de herramientas de voz de código abierto más útiles.

El código abierto de Amphion promoverá el avance de la tecnología de generación de audio, música y voz, brindará comodidad a más desarrolladores y promoverá la investigación y aplicaciones en campos relacionados. Creo que Amphion se utilizará más ampliamente en el futuro y nos traerá más sorpresas. Esperamos su futuro desarrollo y mejora.