인공지능 기업 카테시아(Cartesia)가 원음의 억양과 억양 등 표현적 특징을 유지하면서 음성을 변환할 수 있는 보이스 체인저(Voice Changer)라는 음성 변환 모델을 출시했다. 화자의 음색 변화를 잃어 변환된 음성이 더 기계적으로 들리는 경향이 있는 기존 음성 변환 도구와 달리 Cartesia의 Voice Changer는 음성 변환을 유지하면서 화자의 감정과 음색을 복원하는 데 더 많은 주의를 기울여 음성 변환의 현실감과 자연스러움을 크게 향상시킵니다. 개선되었습니다. 다운코드 편집자는 이 새로운 모델에 대해 심층적으로 이해할 수 있도록 안내합니다.
인공지능 기업 카테시아(Cartesia)는 최근 보이스 체인저(Voice Changer)라는 음성 변환 모델을 출시했다. 기존 음성 변환과 달리 이 모델은 입력 음성을 대상 사운드로 변환할 수 있을 뿐만 아니라 원음의 억양, 강세 및 기타 표현 특성을 유지할 수 있습니다.
Cartesia 관계자에 따르면 사용자는 play.cartesia.ai 웹사이트에서 이 기능을 사용해 볼 수 있습니다. 현재 회사는 관련 API 문서를 공개했으며 개발자는 docs.cartesia.ai에서 자세한 지침을 볼 수 있습니다.
기자는 이런 음성 특성을 그대로 유지한 변환 기술이 시장에서는 흔하지 않다는 점에 주목했다. 대부분의 기존 도구는 음성을 변환할 때 화자의 억양을 잃어 변환된 음성이 로봇처럼 들리는 경향이 있습니다.
Cartesia는 블로그에서 이 기술이 어떻게 구현되는지 자세히 설명합니다. 그러나 회사는 타인의 목소리를 무단으로 모방하는 등 이 기술이 가져올 수 있는 윤리적 문제에 대해서는 아직까지 대응하지 않고 있습니다.
보이스 체인저(Voice Changer) 모델의 등장은 음성 변환 기술에 새로운 돌파구를 가져왔지만 윤리적 문제에 대한 우려도 불러일으켰습니다. 카테시아는 향후 이러한 잠재적 위험에 대해 보다 심층적인 연구와 논의를 진행하여 기술의 합리적인 적용을 보장할 수 있기를 바랍니다. Downcodes의 편집자는 이 기술의 후속 개발에 계속해서 주의를 기울일 것입니다.