CoMoSVC : technologie innovante qui convertit la voix chantée d’une personne en voix chantée d’une autre personne

Auteur：Eve Cole Date de mise à jour：2025-01-21 11:48:02

L'Université de Hong Kong et Microsoft Research Asia ont collaboré pour développer une technologie révolutionnaire de conversion vocale : CoMoSVC. La capacité de la technologie à transformer la voix chantée d'une personne en la voix chantée d'une autre réside essentiellement dans une combinaison intelligente de modèles d'enseignants basés sur la diffusion et d'attributs d'auto-cohérence. Cela permet à CoMoSVC d'atteindre une vitesse de traitement sans précédent tout en garantissant une conversion audio de haute qualité, apportant des changements révolutionnaires dans les domaines de la production musicale et du traitement audio.

CoMoSVC, une technologie innovante développée conjointement par l'Université de Hong Kong et des chercheurs de Microsoft Asie, peut convertir la voix chantée d'une personne en voix chantée d'une autre personne. Il atteint un équilibre entre une conversion audio de haute qualité et une vitesse de traitement rapide en utilisant un modèle d'enseignant basé sur la diffusion et des propriétés d'auto-cohérence pour la conversion sonore. Contrairement au processus d'échantillonnage itératif traditionnel, CoMoSVC implémente un échantillonnage en une étape, accélérant considérablement le traitement et maintenant une conversion de haute qualité. Cette technologie innovante apportera des solutions plus efficaces et plus pratiques à la conversion audio, offrant ainsi davantage de possibilités de création et d'expression dans des domaines tels que la production musicale.

Grâce à ses fonctionnalités efficaces et pratiques, la technologie CoMoSVC devrait être largement utilisée dans la création musicale, la synthèse vocale et dans d'autres domaines, offrant aux utilisateurs des options de traitement audio plus riches et favorisant davantage le développement et l'innovation de la technologie audio. L'augmentation de la vitesse apportée par sa technologie d'échantillonnage en une étape offre également de nouvelles possibilités de traitement audio en temps réel.