MockingBird は、あなたの声を複製し、任意の音声コンテンツを生成できる AI オノマトペ システムです。
特性
1. テキストは中国語をサポートしており、さまざまな中国語データ セット (aidatang_200zh、magicdata、aishell3、biaobei、MozillaCommonVoice、data_aishell など) を使用してテストされています。
2. PyTorch は pytorch に適しており、1.9.0 (2021 年 8 月最新)、GPU Tesla T4 および GTX 2060 でテストされています。
3. Windows + Linux は、Windows オペレーティング システムおよび Linux オペレーティング システムで実行できます (Apple システム M1 バージョンには、コミュニティでの成功した運用事例もあります)
4. 簡単で素晴らしい シンセサイザー (シンセサイザー) をダウンロードするか新たにトレーニングするだけで良い結果が得られ、事前トレーニングされたエンコーダー/ボコーダー、またはリアルタイム HiFi-GAN をボコーダーとして再利用します。
5. Webserver Ready はトレーニング結果をリモート通話に提供できます
始める
インストール要件
元のリポジトリに従って、すべての環境が準備できているかどうかをテストします。ツールボックスを実行するには、Python 3.7 以降が必要です。
PyTorchをインストールします。
pip でインストールすると ERROR: Could not find a version that Satisfied the require torch==1.9.0+cu102 (from version: 0.1.2, 0.1.2.post1, 0.1.2.post2) が発生する場合は Python が原因である可能性があります値が低すぎるため、3.9 は正常にインストールできます
ffmpegをインストールします。
pip install -r required.txt を実行して、残りの必要なパッケージをインストールします。
webrtcvad pip install webrtcvad-wheels をインストールします。