Un framework de changement de voix simple et facile à utiliser basé sur VITS
Journal de mise à jour | FAQ | AutoDL·5 cents pour former le chanteur AI | Enregistrement d'expérience contrôlée |
Anglais |中文简体|日本语| 한국어 ( Coréen ) Français |
Le modèle de base est formé à l'aide de près de 50 heures d'ensemble de formation VCTK open source de haute qualité. N'hésitez pas à l'utiliser.
Veuillez attendre avec impatience le modèle inférieur de RVCv3, qui a des paramètres plus grands, des données plus volumineuses, de meilleurs résultats, fondamentalement la même vitesse d'inférence et nécessite moins de données d'entraînement.
Interface d'inférence de formation | Interface de changement de voix en temps réel |
go-web.bat | go-realtime-gui.bat |
Vous êtes libre de choisir ce que vous voulez faire. | Nous avons atteint une latence de bout en bout de 170 ms. Si vous utilisez des périphériques d'entrée et de sortie ASIO, vous pouvez atteindre une latence de bout en bout de 90 ms, mais cela dépend fortement de la prise en charge des pilotes matériels. |
Cet entrepôt présente les caractéristiques suivantes
Utilisez la recherche top1 pour remplacer les fonctionnalités de la source d'entrée par les fonctionnalités de l'ensemble d'entraînement afin d'éviter les fuites de timbre.
Formation rapide même sur des cartes graphiques relativement médiocres
L'utilisation d'une petite quantité de données pour l'entraînement peut également donner de meilleurs résultats (il est recommandé de collecter au moins 10 minutes de données vocales à faible bruit)
Le timbre peut être modifié via la fusion de modèles (à l'aide de ckpt-merge dans l'onglet de traitement ckpt)
Interface Web simple et facile à utiliser
Le modèle UVR5 peut être appelé pour séparer rapidement le chant et l'accompagnement
Utilisez l'algorithme d'extraction de hauteur de voix humaine le plus avancé InterSpeech2023-RMVPE pour éliminer le problème des sons muets. Fonctionne mieux (de manière significative) mais est plus rapide et plus petit que crepe_full
Prise en charge de l'accélération d'une carte I
Cliquez ici pour voir notre vidéo de démonstration !
Les instructions suivantes doivent être exécutées dans un environnement avec une version Python supérieure à 3.8.
Choisissez l'une des méthodes suivantes.
Installez Pytorch et ses dépendances principales, ignorez-le s'il est déjà installé. Référence de : https://pytorch.org/get-started/locally/
pip installer la torche torchvision torchaudio
S'il s'agit d'un système win + architecture Nvidia Ampere (RTX30xx), selon l'expérience du #21, vous devez préciser la version cuda correspondant à pytorch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
Installez les dépendances correspondantes selon votre propre carte graphique
Carte N
pip install -r exigences.txt
Une carte/une carte
pip install -r exigences-dml.txt
Une carte ROCM (Linux)
pip install -r exigences-amd.txt
Carte IIPEX(Linux)
pip install -r exigences-ipex.txt
Installez l'outil de gestion des dépendances Poetry, ignorez-le s'il est déjà installé. Référence de : https://python-poetry.org/docs/#installation
curl -sSL https://install.python-poetry.org | python3 -
Lors de l'installation de dépendances via Poetry, il est recommandé à Python d'utiliser les versions 3.7 à 3.10. D'autres versions entreront en conflit lors de l'installation de llvmlite==0.39.0.
poésie init -n poésie env utilise "chemin d'accès à votre python.exe" poésie exécuter pip install -r exigences.txt
Les dépendances peuvent être installées via run.sh
sh ./run.sh
RVC nécessite d'autres pré-modèles pour l'inférence et la formation.
Vous pouvez télécharger ces modèles depuis notre espace Hugging Face.
Vous trouverez ci-dessous une liste avec les noms de tous les pré-modèles et autres fichiers requis pour RVC. Vous pouvez trouver les scripts pour les télécharger dans le dossier tools
.
./assets/hubert/hubert_base.pt
./assets/pré-entraîné
./actifs/uvr5_weights
Si vous souhaitez utiliser le modèle de la version v2, vous devez le télécharger en plus.
./assets/pretrained_v2
Si ffmpeg et ffprobe sont déjà installés, ignorez-les.
sudo apt installer ffmpeg
infuser installer ffmpeg
Après le téléchargement, placez-le dans le répertoire racine.
Télécharger ffmpeg.exe
Télécharger ffprobe.exe
Si vous souhaitez utiliser le dernier algorithme d'extraction de hauteur vocale RMVPE, vous devez télécharger les paramètres du modèle d'extraction de hauteur et les placer dans le répertoire racine RVC.
téléchargerrmvpe.pt
Téléchargerrmvpe.onnx
Si vous souhaitez exécuter RVC sur un système Linux basé sur la technologie Rocm d'AMD, veuillez d'abord installer les pilotes requis ici.
Si vous utilisez Arch Linux, vous pouvez utiliser pacman pour installer les pilotes requis :
pacman -S rocm-hip-sdk rocm-opencl-sdk
Pour certains modèles de cartes graphiques, vous devrez peut-être configurer en plus les variables d'environnement suivantes (par exemple : RX6700XT) :
export ROCM_PATH=/opt/rocm export HSA_OVERRIDE_GFX_VERSION=10.3.0
Assurez-vous également que votre utilisateur actuel fait partie render
et video
:
sudo usermod -aG render $USERNAME sudo usermod -aG video $USERNAME
Utilisez la commande suivante pour démarrer WebUI
python inférer-web.py
Si vous avez déjà utilisé Poetry pour installer des dépendances, vous pouvez démarrer WebUI de la manière suivante
poésie exécuter python infer-web.py
Téléchargez et décompressez RVC-beta.7z
Double-cliquez sur go-web.bat
sh ./run.sh
source /opt/intel/oneapi/setvars.sh