Cartesia libera un nuevo modelo de conversión de voz: puede retener las características del tono del altavoz - Artículo de IA

Autor：Eve Cole Fecha de actualización：2025-02-15 16:32:01

La tecnología de inteligencia artificial está constantemente rompiendo los límites de la innovación, y el campo de la conversión de voz ha marcado el comienzo de un gran progreso. El modelo de cambio de voz lanzado por Cartesia trae nuevas posibilidades a la industria con su capacidad de retención única de las características de voz.

La compañía de inteligencia artificial Cartesia lanzó recientemente un modelo de conversión de voz llamado "cambiador de voz". A diferencia de la conversión de voz tradicional, este modelo no solo puede convertir la voz de entrada en el sonido objetivo, sino también mantener las características de expresión del tono, el estrés y otras expresiones en el sonido original.

Según la introducción oficial de Cartesia, los usuarios pueden probar esta función en el sitio web Play.Cartesia.ai. La Compañía ha publicado documentos API relevantes, y los desarrolladores pueden ver instrucciones detalladas a través de Docs.Cartesia.ai.

El periodista notó que este tipo de tecnología de conversión que conserva las características de voz no es común en el mercado. La mayoría de las herramientas existentes tienden a perder los cambios en el tono del altavoz al convertir los sonidos, lo que resulta en los sonidos convertidos más mecánicos.

Cartesia detalla la implementación específica de la tecnología en su blog. Sin embargo, la compañía aún no ha respondido a problemas éticos que pueden ser provocados por esta tecnología, como imitar las voces de otras personas sin autorización.

Esta tecnología innovadora ha abierto nuevas direcciones para el campo de la conversión de voz, pero también ha desencadenado el pensamiento de las personas sobre la ética tecnológica.