Компания по искусственному интеллекту Cartesia выпустила модель преобразования речи под названием Voice Changer, которая может преобразовывать речь, сохраняя при этом интонацию и акцент исходного голоса, а также другие выразительные функции. Эта технология относительно редка на рынке. В отличие от традиционных инструментов преобразования голоса, которые имеют тенденцию терять изменения тона говорящего, в результате чего преобразованный голос звучит более механически, Voice Changer от Cartesia уделяет больше внимания восстановлению эмоций и тона говорящего, сохраняя при этом преобразование голоса, что значительно улучшает реалистичность и естественность преобразования речи. улучшаются. Редактор Downcodes поможет вам глубже понять эту новую модель.
Компания по искусственному интеллекту Cartesia недавно запустила модель преобразования речи под названием Voice Changer. В отличие от традиционного преобразования речи, эта модель может не только преобразовывать входную речь в целевой звук, но также сохранять интонацию, ударение и другие характеристики выражения исходного звука.
По словам представителей Cartesia, пользователи могут опробовать эту функцию на сайте play.cartesia.ai. В настоящее время компания выпустила соответствующие документы по API, а подробные инструкции разработчики могут просмотреть на docs.cartesia.ai.
Репортер заметил, что этот тип технологии преобразования, сохраняющий характеристики голоса, не распространен на рынке. Большинство существующих инструментов имеют тенденцию терять интонации говорящего при преобразовании голоса, в результате чего преобразованный голос звучит как робот.
Cartesia подробно описывает, как эта технология реализуется, в своем блоге. Однако компания пока не отреагировала на этические проблемы, которые может принести эта технология, например, несанкционированную имитацию голосов других людей.
Появление модели Voice Changer принесло новые прорывы в технологии преобразования голоса, но также вызвало обеспокоенность по поводу этических проблем. Есть надежда, что Cartesia сможет провести более глубокие исследования и обсуждения этих потенциальных рисков в будущем, чтобы обеспечить разумное применение технологий. Редактор Downcodes продолжит уделять внимание дальнейшему развитию этой технологии.