Le Shanghai AI Laboratory, l'École de science des données de l'Université chinoise de Hong Kong et le Shenzhen Big Data Research Institute ont publié conjointement une boîte à outils open source de génération audio, musicale et vocale appelée Amphion. Il s’agit d’une nouvelle passionnante qui fournira aux développeurs dans les domaines liés à l’audio des outils et des ressources puissants et favorisera le développement rapide de ce domaine. Amphion comprend des infrastructures telles que le traitement des données, des modules généraux et des algorithmes d'optimisation, et prévoit d'intégrer davantage de modèles vocaux à l'avenir, dans le but de devenir l'une des meilleures boîtes à outils vocales open source. Il s’agit sans aucun doute d’une ressource précieuse pour les chercheurs et les développeurs.
Le Shanghai AI Laboratory, l'École de science des données de l'Université chinoise de Hong Kong et le Shenzhen Big Data Research Institute ont conjointement ouvert une boîte à outils de génération audio, musicale et vocale appelée Amphion. Amphion peut aider les développeurs à rechercher de l'audio, de la musique et d'autres domaines liés à l'audio générés par du texte. La boîte à outils comprend des infrastructures telles que le traitement des données, des modules généraux et des algorithmes d'optimisation, et prévoit d'ajouter davantage de modèles liés à la parole à l'avenir pour créer l'une des boîtes à outils vocales open source les plus utiles.
L'open source d'Amphion favorisera l'avancement de la technologie de génération audio, musicale et vocale, offrira une commodité à davantage de développeurs et favorisera la recherche et les applications dans des domaines connexes. Je pense qu'Amphion sera plus largement utilisé à l'avenir et nous apportera plus de surprises. Dans l’attente de son développement et de son amélioration futurs.