La Universidad de Hong Kong y Microsoft Research Asia colaboraron para desarrollar una innovadora tecnología de conversión de voz: CoMoSVC. La capacidad de la tecnología para transformar la voz de canto de una persona en la voz de canto de otra reside en su núcleo en una inteligente combinación de modelos docentes basados en la difusión y atributos de autoconsistencia. Esto permite a CoMoSVC alcanzar una velocidad de procesamiento sin precedentes al tiempo que garantiza una conversión de audio de alta calidad, lo que trae cambios revolucionarios a los campos de la producción musical y el procesamiento de audio.
CoMoSVC, una tecnología innovadora desarrollada conjuntamente por la Universidad de Hong Kong y investigadores de Microsoft Asia, puede convertir la voz de una persona en la voz de otra. Logra un equilibrio entre conversión de audio de alta calidad y velocidad de procesamiento rápida mediante el uso de un modelo docente basado en difusión y propiedades de autoconsistencia para la conversión de sonido. A diferencia del proceso de muestreo iterativo tradicional, CoMoSVC implementa un muestreo en un solo paso, lo que acelera enormemente el procesamiento y mantiene una conversión de alta calidad. Esta innovadora tecnología brindará soluciones más eficientes y convenientes para la conversión de audio, brindando más posibilidades de creación y expresión en áreas como la producción musical.
Con sus características eficientes y convenientes, se espera que la tecnología CoMoSVC se utilice ampliamente en la creación musical, la síntesis de voz y otros campos, brindando a los usuarios opciones de procesamiento de audio más ricas y promoviendo aún más el desarrollo y la innovación de la tecnología de audio. El aumento de velocidad aportado por su tecnología de muestreo de un solo paso también ofrece nuevas posibilidades para el procesamiento de audio en tiempo real.