A tecnologia de inteligência artificial está constantemente rompendo os limites da inovação, e o campo da conversão de voz deu início a grandes progressos. O modelo de trocador de voz lançado pela Cartesia traz novas possibilidades ao setor com sua capacidade de retenção exclusiva dos recursos de voz.
A empresa de inteligência artificial Cartesia lançou recentemente um modelo de conversão de voz chamado "Voice Changer". Diferentemente da conversão de voz tradicional, esse modelo pode não apenas converter a voz de entrada em som de destino, mas também manter as características da expressão do tom, estresse e outras expressões no som original.
De acordo com a introdução oficial da Cartesia, os usuários podem tentar esse recurso no site da play.cartesia.ai. A empresa divulgou documentos de API relevantes e os desenvolvedores podem visualizar instruções detalhadas através do doc.Cartesia.ai.
O repórter percebeu que esse tipo de tecnologia de conversão que retém as características de voz não é comum no mercado. A maioria das ferramentas existentes tende a perder as mudanças no tom do falante ao converter sons, resultando em sons convertidos parece mais mecânica.
A Cartesia detalha a implementação específica da tecnologia em seu blog. No entanto, a empresa ainda não respondeu a questões éticas que podem ser provocadas por essa tecnologia, como imitar as vozes de outras pessoas sem autorização.
Essa tecnologia inovadora abriu novas direções para o campo da conversão de voz, mas também desencadeou o pensamento das pessoas sobre ética tecnológica.