RVC v2 UIダウンロード - RVC v2 UIソースコードのダウンロード

RVC v2 UI

VC/VC++

ダウンロード

RVCボイスチェンジャー

RVC v2 でトレーニングされた AI 音声モデルを使用して音声を変更する自律パイプライン。このツールを使用すると、任意のオーディオ入力に音声変換を適用できます。

WebUI は継続的に開発とテストが行われていますが、ローカルで今すぐ試すことができます。

RVC ボイスチェンジャーを最新バージョンにアップデートする

RVC-v2-UIディレクトリでコマンドラインウィンドウを開いて次のコマンドを実行することにより、新しい要件と変更をインストールおよびプルします。

pip install -r requirements.txt
git pull

colab ユーザーの場合は、colab ノートブックの上部ナビゲーションバーでRuntimeをクリックし、ドロップダウンメニューでDisconnect and delete runtimeクリックするだけです。次に、ノートブックの指示に従って webui を実行します。

コラボノート

(近いうちに来るといいですね)

設定

Git と Python をインストールする

ここの手順に従って、コンピューターに Git をインストールします。まだインストールしていない場合は、このガイドに従って Pythonバージョン 3.9 をインストールします。他のバージョンの Python を使用すると、依存関係の競合が発生する可能性があります。

あるいは、pyenv を使用して Python のバージョンを管理することもできます。

ここの手順に従って pyenv をインストールします。
Python 3.9 をインストールします。

pyenv install 3.9

これをローカルの Python バージョンとして設定します。

pyenv local 3.9

ffmpegをインストールする

ここの手順に従って、ffmpeg をコンピュータにインストールします。

RVC-v2-UI リポジトリのクローンを作成し、仮想環境をセットアップする

コマンドラインウィンドウを開き、次のコマンドを実行して、このリポジトリ全体のクローンを作成し、仮想環境を作成し、必要な追加の依存関係をインストールします。

git clone https://github.com/PseudoRAM/RVC-v2-UI
cd RVC-v2-UI

仮想環境の作成とアクティブ化

pyenvの使用

pyenv exec python -m venv venv

pyenvを使用しない

python -m venv venv

仮想環境をアクティブ化する

窓

venvScriptsactivate

macOS と Linux

source venv/bin/activate

依存関係をインストールする

pip install -r requirements.txt

必要なモデルをダウンロードする

次のコマンドを実行して、必要な Hubert 基本モデルをダウンロードします。

python src/download_models.py

WebUIでの使い方

RVC ボイスチェンジャー WebUI を実行するには、次のコマンドを実行します。

python src/webui.py

フラグ	説明
`-h` 、 `--help`	このヘルプメッセージを表示して終了します。
`--share`	パブリック URL を作成します。これは、Google Colab で Web UI を実行する場合に便利です。
`--listen`	ローカルネットワークから Web UI にアクセスできるようにします。
`--listen-host LISTEN_HOST`	サーバーが使用するホスト名。
`--listen-port LISTEN_PORT`	サーバーが使用するリスニングポート。

次の出力メッセージRunning on local URL: http://127.0.0.1:7860が表示されたら、リンクをクリックして WebUI のタブを開くことができます。

WebUI 経由で RVC モデルをダウンロード

Download modelタブに移動し、ダウンロードリンクを RVC モデルに貼り付け、一意の名前を付けます。 AI Hub Discord を検索すると、すでにトレーニングされた音声モデルをダウンロードできます。ダウンロードリンクがどのように表示されるかについては、例を参照してください。ダウンロードした zip ファイルには、.pth モデルファイルとオプションの .index ファイルが含まれている必要があります。

2 つの入力フィールドに入力したら、 Downloadクリックするだけです。出力メッセージに[NAME] Model successfully downloaded!と表示されたら、 , [モデルを更新] ボタンをクリックすると、 Convert Voiceタブで使用できるようになります。

WebUI 経由で RVC モデルをアップロードする

RVC v2 モデルをローカルでトレーニングしており、音声変換に使用したいと考えている人向け。 Upload modelタブに移動し、指示に従います。出力メッセージに[NAME] Model successfully uploaded!と表示されたら、 , [モデルを更新] ボタンをクリックすると、 Convert Voiceタブで使用できるようになります。

WebUI 経由でパイプラインを実行する

webui_generate (1).png

[音声モデル] ドロップダウンメニューから、使用する音声モデルを選択します。ファイルを RVC_models ディレクトリに手動で追加してリストを更新した場合は、 Refresh Modelsをクリックします。
「入力音声」フィールドで、音声ファイルをアップロードします。
必要に応じてピッチを調整します。出力される音声のピッチが変化します。
音声変換のその他の詳細オプションは、アコーディオン矢印をクリックして展開することで表示できます。

すべてのオプションを入力したら、 Convertをクリックすると、GPU に応じて、数分以内に AI で生成された音声が表示されます。

CLIでの使用法

パイプラインの実行

コマンドラインを使用して音声変換パイプラインを実行するには、次のコマンドを実行します。

python src/main.py <input_audio> <rvc_model> [pitch] [f0_method] [index_rate] [filter_radius] [rms_mix_rate] [protect]

パラメータ	説明
`input_audio`	入力音声ファイルへのパス。
`rvc_model`	使用する RVC モデルの名前。
`pitch`	(オプション) 半音単位でピッチを変更します。デフォルトは 0 です。
`f0_method`	(オプション) ピッチ検出アルゴリズム。オプション: 'rmvpe' (デフォルト) または 'mangio-crepe'。
`index_rate`	(オプション) 音声変換のインデックスレート。デフォルトは 0.5 です。範囲: 0 ～ 1。
`filter_radius`	(オプション) メディアンフィルタリングのフィルタ半径。デフォルトは 3 です。範囲: 0 ～ 7。
`rms_mix_rate`	(オプション) RMS ミックスレート。デフォルトは 0.25 です。範囲: 0 ～ 1。
`protect`	（オプション）元の音声特性の一部を維持するためにレートを保護します。デフォルトは 0.33 です。範囲: 0 ～ 0.5。

使用例:

python src/main.py "path/to/input/audio.wav" "JohnDoe" 2 rmvpe 0.7 3 0.3 0.35

このコマンドは、「JohnDoe」RVC モデルを使用して「audio.wav」の音声を変換し、「rmvpe」ピッチ検出アルゴリズムを使用して、インデックスレート 0.7、フィルター半径 3、RMS ミックスでピッチを 2 半音上げます。レート0.3、プロテクトレート0.35。

RVC モデルの手動ダウンロード

(必要に応じて) 解凍し、 .pthファイルと.indexファイルを RVC_models ディレクトリ内の新しいフォルダーに転送します。各フォルダーには.pthファイルと.indexファイルを 1 つだけ含める必要があります。

ディレクトリ構造は次のようになります。

├── rvc_models
│   ├── John
│   │   ├── JohnV2.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── May
│   │   ├── May.pth
│   │   └── added_IVF2237_Flat_nprobe_1_v2.index
│   ├── MODELS.txt
│   └── hubert_base.pt
├── voice_output
└── src