A empresa de inteligência artificial Cartesia lançou um modelo de conversão de fala chamado Voice Changer, que pode converter a fala enquanto mantém a entonação e o sotaque da voz original e outros recursos expressivos. Essa tecnologia é relativamente rara no mercado. Ao contrário das ferramentas tradicionais de conversão de voz que tendem a perder as mudanças de tom do locutor, fazendo com que a voz convertida soe mais mecânica, o Voice Changer da Cartesia presta mais atenção em restaurar a emoção e o tom do locutor, mantendo a conversão de voz, melhorando significativamente o realismo e a naturalidade da conversão de fala. são melhorados. O editor de Downcodes levará você a um conhecimento aprofundado deste novo modelo.
A empresa de inteligência artificial Cartesia lançou recentemente um modelo de conversão de fala chamado Voice Changer. Diferente da conversão de fala tradicional, este modelo pode não apenas converter a fala de entrada no som alvo, mas também manter a entonação, a ênfase e outras características de expressão do som original.
De acordo com funcionários da Cartesia, os usuários podem experimentar esse recurso no site play.cartesia.ai. Atualmente, a empresa lançou documentos API relevantes e os desenvolvedores podem visualizar instruções detalhadas em docs.cartesia.ai.
O repórter percebeu que esse tipo de tecnologia de conversão que mantém características de voz não é comum no mercado. A maioria das ferramentas existentes tende a perder as inflexões do locutor ao converter uma voz, fazendo com que a voz convertida pareça robótica.
A Cartesia detalha como essa tecnologia é implementada em seu blog. Porém, a empresa ainda não respondeu às questões éticas que esta tecnologia pode trazer, como a imitação não autorizada da voz de outras pessoas.
O surgimento do modelo Voice Changer trouxe novos avanços à tecnologia de conversão de voz, mas também levantou preocupações sobre questões éticas. Espera-se que a Cartesia possa realizar pesquisas e discussões mais aprofundadas sobre estes riscos potenciais no futuro para garantir a aplicação razoável da tecnologia. O editor do Downcodes continuará atento ao posterior desenvolvimento desta tecnologia.