VITS に基づいたシンプルで使いやすい音声変更フレームワーク
更新ログ| AutoDL・5 セントで AI 歌手を育成するオンラインデモ|
English |中文简体|日本語| 한국어 (韓国語) |
基本モデルは、約 50 時間のオープンソースの高品質 VCTK トレーニング セットを使用してトレーニングされています。著作権に関する懸念はありません。
RVCv3 の最下位モデルにご期待ください。このモデルは、より大きなパラメータ、より大きなデータ、より良い結果を持ち、基本的に同じ推論速度で、より少ないトレーニング データを必要とします。
トレーニング推論インターフェイス | リアルタイム音声変更インターフェース |
go-web.bat | go-realtime-gui.bat |
何をしたいかは自由に選択できます。 | エンドツーエンドのレイテンシー 170ms を達成しました。 ASIO 入出力デバイスを使用すると、エンドツーエンドで 90 ミリ秒の遅延を達成できますが、これはハードウェア ドライバーのサポートに大きく依存します。 |
この倉庫には以下のような特徴があります
トップ 1 検索を使用して入力ソースの特徴をトレーニング セットの特徴に置き換え、音色漏れを防ぎます
比較的性能の悪いグラフィックス カードでも高速トレーニング
トレーニングに少量のデータを使用すると、より良い結果が得られる場合もあります (少なくとも 10 分間の低ノイズ音声データを収集することをお勧めします)。
音色はモデルフュージョンを通じて変更できます (ckpt 処理タブの ckpt-merge を使用)
シンプルで使いやすいWebインターフェース
UVR5モデルを呼び出してボーカルと伴奏を素早く分離可能
最先端の人声ピッチ抽出アルゴリズム InterSpeech2023-RMVPE を使用し、音がミュートになる問題を解消します。 (大幅に) 最良の動作をしますが、crepe_full よりも高速で小さいです
AカードIカード加速サポート
ここをクリックしてデモビデオをご覧ください。
次の手順は、Python バージョン 3.8 以降の環境で実行する必要があります。
次のいずれかの方法を選択します。
Pytorch とそのコアの依存関係をインストールします。すでにインストールされている場合はスキップしてください。参照元: https://pytorch.org/get-started/locally/
pip インストール トーチ torchvision torchaudio
winシステム+Nvidia Ampereアーキテクチャ(RTX30xx)の場合、#21の経験によれば、pytorchに対応したcudaバージョンを指定する必要があります
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
独自のグラフィックス カードに応じて、対応する依存関係をインストールします。
Nカード
pip install -r 要件.txt
Aカード/Iカード
pip install -r 要件-dml.txt
カード ROCM (Linux)
pip install -r 要件-amd.txt
アイカードIPEX(Linux)
pip install -r 要件-ipex.txt
Poetry 依存関係管理ツールをインストールします。すでにインストールされている場合はスキップします。参照元: https://python-poetry.org/docs/#installation
カール -sSL https://install.python-poetry.org -
Poetry を通じて依存関係をインストールする場合、Python ではバージョン 3.7 ~ 3.10 を使用することをお勧めします。llvmlite==0.39.0 をインストールすると他のバージョンと競合します。
詩の初期化 -n 詩の環境では、「python.exe へのパス」を使用します。詩の実行 pip install -rrequirements.txt
依存関係はrun.sh
を通じてインストールできます。
sh ./run.sh
RVC では、推論とトレーニングのために他のいくつかの事前モデルが必要です。
これらのモデルは、Hugging Face スペースからダウンロードできます。
以下は、RVC に必要なすべてのプレモデルとその他のファイルの名前のリストです。ダウンロードするスクリプトはtools
フォルダーにあります。
./assets/hubert/hubert_base.pt
./assets/事前トレーニング済み
./assets/uvr5_weights
v2版モデルを利用したい場合は追加でダウンロードする必要があります。
./assets/pretrained_v2
ffmpeg と ffprobe がすでにインストールされている場合は、スキップしてください。
sudo apt install ffmpeg
ffmpegを醸造インストールする
ダウンロード後、ルートディレクトリに置きます。
ffmpeg.exeをダウンロード
ffprobe.exeをダウンロード
最新の RMVPE ボーカル ピッチ抽出アルゴリズムを使用する場合は、ピッチ抽出モデル パラメータをダウンロードし、RVC ルート ディレクトリに配置する必要があります。
ダウンロードrmvpe.pt
ダウンロードrmvpe.onnx
AMD の Rocm テクノロジーに基づいた Linux システム上で RVC を実行する場合は、まずここで必要なドライバーをインストールしてください。
Arch Linux を使用している場合は、pacman を使用して必要なドライバーをインストールできます。
pacman -S rocm-hip-sdk rocm-opencl-sdk
グラフィックス カードの一部のモデルでは、次の環境変数を追加で構成する必要がある場合があります (例: RX6700XT)。
export ROCM_PATH=/opt/rocm export HSA_OVERRIDE_GFX_VERSION=10.3.0
また、現在のユーザーがrender
グループとvideo
ユーザー グループに属していることを確認してください。
sudo usermod -aG render $USERNAME sudo usermod -aG video $USERNAME
次のコマンドを使用して WebUI を起動します
Python infer-web.py
以前に Poetry を使用して依存関係をインストールした場合は、次の方法で WebUI を起動できます。
Python infer-web.pyで詩を実行します
RVC-beta.7z
ダウンロードして解凍します。
go-web.bat
ダブルクリックします
sh ./run.sh
ソース/opt/intel/oneapi/setvars.sh