Meta、口調や話す速度の模倣をサポートする新しい音声翻訳モデルをリリース
メタ社はこのほど、新しい音声翻訳モデル「シームレスコミュニケーション」シリーズをリリースし、約2秒の遅延制御で約100言語間のリアルタイム音声翻訳をサポートする4モデルを含む。このモデルは、ソース音声のポーズ、トーン、話す速度などの複雑な特徴を再現できるため、翻訳がより現実的になります。非自己回帰アーキテクチャを採用し、長期的なサポートを実現
2025-01-17