人工知能技術は、イノベーションの境界を絶えず突破しており、音声変換の分野は大きな進歩を遂げています。カルテシアによって開始された音声チェンジャーモデルは、音声機能のユニークな保持能力により、業界に新しい可能性をもたらします。
人工知能会社Cartesiaは最近、「Voice Changer」と呼ばれる音声変換モデルを立ち上げました。従来の音声変換とは異なり、このモデルは入力音声をターゲットサウンドに変換するだけでなく、トーン、ストレス、その他の式の式の特性を元のサウンドで維持できます。
Cartesiaの公式の紹介によると、ユーザーはこの機能をPlay.cartesia.ai Webサイトで試すことができます。同社は関連するAPIドキュメントをリリースしており、開発者はdocs.cartesia.aiを使用して詳細な指示を表示できます。
レポーターは、音声特性を保持するこのタイプの変換技術は市場では一般的ではないことに気付きました。ほとんどの既存のツールは、サウンドを変換するときにスピーカーのトーンの変化を失う傾向があり、その結果、変換されたサウンドがより機械的にサウンドになります。
カルテシアは、ブログのテクノロジーの特定の実装を詳述しています。しかし、同社は、認可なしに他の人の声を模倣するなど、この技術によってもたらされる可能性のある倫理的問題にまだ対応していません。
この革新的なテクノロジーは、音声変換の分野の新しい方向性を開きましたが、技術倫理と規範のバランスを見つける方法を人々の考え方を引き起こしました。