La société d'intelligence artificielle Cartesia a publié un modèle de conversion vocale appelé Voice Changer, qui peut convertir la parole tout en conservant l'intonation et l'accent de la voix originale ainsi que d'autres caractéristiques expressives. Cette technologie est relativement rare sur le marché. Contrairement aux outils de conversion vocale traditionnels qui ont tendance à perdre les changements de ton du locuteur, ce qui rend la voix convertie plus mécanique, le changeur de voix de Cartesia accorde plus d'attention à la restauration de l'émotion et du ton du locuteur tout en maintenant la conversion vocale, améliorant considérablement le réalisme et le naturel de la conversion vocale. sont améliorés. L'éditeur de Downcodes vous amènera à comprendre en profondeur ce nouveau modèle.
La société d'intelligence artificielle Cartesia a récemment lancé un modèle de conversion vocale appelé Voice Changer. Différent de la conversion vocale traditionnelle, ce modèle peut non seulement convertir la parole entrante en son cible, mais également conserver l'intonation, l'accentuation et d'autres caractéristiques d'expression du son original.
Selon les responsables de Cartesia, les utilisateurs peuvent essayer cette fonctionnalité sur le site play.cartesia.ai. À l'heure actuelle, la société a publié des documents API pertinents et les développeurs peuvent consulter des instructions détaillées sur docs.cartesia.ai.
Le journaliste a remarqué que ce type de technologie de conversion qui conserve les caractéristiques vocales n'est pas courant sur le marché. La plupart des outils existants ont tendance à perdre les inflexions du locuteur lors de la conversion d'une voix, ce qui donne à la voix convertie un son robotique.
Cartesia détaille comment cette technologie est mise en œuvre sur son blog. Cependant, l'entreprise n'a pas encore répondu aux problèmes éthiques que cette technologie peut poser, comme l'imitation non autorisée de la voix d'autrui.
L’émergence du modèle Voice Changer a apporté de nouvelles avancées dans la technologie de conversion vocale, mais elle a également soulevé des inquiétudes quant aux questions éthiques. Nous espérons que Cartesia pourra mener des recherches et des discussions plus approfondies sur ces risques potentiels à l'avenir afin de garantir une application raisonnable de la technologie. L'éditeur de Downcodes continuera à prêter attention au développement ultérieur de cette technologie.