Простая и удобная в использовании система изменения голоса на основе VITS.
Обновление журнала | Часто задаваемые вопросы | AutoDL ·5 центов для обучения певца с искусственным интеллектом |
Английский |中文简体|日本语| 한국어 ( корейский ) | Португальский |
Базовая модель обучается с использованием почти 50 часов высококачественного обучающего набора VCTK с открытым исходным кодом. Пожалуйста, не стесняйтесь использовать ее.
Пожалуйста, с нетерпением ждите нижнюю модель RVCv3, которая имеет более крупные параметры, большие данные, лучшие результаты, в основном ту же скорость вывода и требует меньше обучающих данных.
Интерфейс обучающего вывода | Интерфейс изменения голоса в реальном времени |
go-web.bat | go-realtime-gui.bat |
Вы свободны выбирать, чем хотите заниматься. | Мы достигли сквозной задержки в 170 мс. Если вы используете устройства ввода и вывода ASIO, вы можете достичь сквозной задержки 90 мс, но она во многом зависит от поддержки аппаратных драйверов. |
Этот склад имеет следующие характеристики
Используйте поиск по топ1, чтобы заменить функции источника входного сигнала функциями обучающего набора, чтобы предотвратить утечку тембра.
Быстрое обучение даже на относительно плохих видеокартах
Использование небольшого объема данных для обучения также может дать лучшие результаты (рекомендуется собрать как минимум 10 минут речевых данных с низким уровнем шума).
Тембр можно изменить через объединение моделей (с помощью ckpt-merge во вкладке обработки ckpt)
Простой и удобный веб-интерфейс
Модель UVR5 можно вызвать для быстрого разделения вокала и аккомпанемента.
Используйте самый передовой алгоритм извлечения высоты человеческого голоса InterSpeech2023-RMVPE, чтобы устранить проблему приглушенных звуков. Работает лучше всего (значительно), но быстрее и меньше, чем crepe_full.
Поддержка ускорения карты I карты
Нажмите здесь, чтобы просмотреть наше демонстрационное видео!
Следующие инструкции необходимо выполнить в среде с версией Python выше 3.8.
Выберите один из следующих методов.
Установите Pytorch и его основные зависимости, пропустите, если они уже установлены. Ссылка: https://pytorch.org/get-started/locally/
pip install torch torchvision torchaudio
Если это система win + архитектура Nvidia Ampere (RTX30xx), по опыту №21 нужно указать версию cuda, соответствующую pytorch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
Установите соответствующие зависимости в соответствии с вашей видеокартой.
N-карта
pip install -r требования.txt
Карта / I-карта
pip install -r требования-dml.txt
Карта ROCM (Linux)
pip install -r требования-amd.txt
I-картаIPEX(Linux)
pip install -r требования-ipex.txt
Установите инструмент управления зависимостями Poetry, пропустите, если он уже установлен. Ссылка: https://python-poetry.org/docs/#installation.
локон -sSL https://install.python-poetry.org python3 -
При установке зависимостей через Poetry рекомендуется использовать Python версий 3.7-3.10. Другие версии будут конфликтовать при установке llvmlite==0.39.0.
поэзия init -n поэзия env использует «путь к вашему python.exe» поэзия запускает pip install -r требования.txt
Зависимости можно установить через run.sh
ш ./run.sh
RVC требует некоторых других предварительных моделей для вывода и обучения.
Вы можете скачать эти модели из нашего пространства Hugging Face.
Ниже приведен список с названиями всех предварительных моделей и других файлов, необходимых для RVC. Сценарии для их загрузки можно найти в папке tools
.
./assets/hubert/hubert_base.pt
./assets/предварительно обученный
./assets/uvr5_weights
Если вы хотите использовать модель версии v2, вам необходимо скачать ее дополнительно.
./assets/pretrained_v2
Если ffmpeg и ffprobe уже установлены, пропустите их.
sudo apt установить ffmpeg
заварить установку ffmpeg
После загрузки поместите его в корневой каталог.
Скачать ffmpeg.exe
Скачать ffprobe.exe
Если вы хотите использовать новейший алгоритм извлечения высоты голоса RMVPE, вам необходимо загрузить параметры модели извлечения высоты звука и поместить их в корневой каталог RVC.
скачатьrmvpe.pt
Скачать rmvpe.onnx
Если вы хотите запустить RVC в системе Linux на основе технологии AMD Rocm, сначала установите здесь необходимые драйверы.
Если вы используете Arch Linux, вы можете использовать pacman для установки необходимых драйверов:
pacman -S rocm-hip-sdk rocm-opencl-sdk
Для некоторых моделей видеокарт может потребоваться дополнительная настройка следующих переменных среды (например: RX6700XT):
export ROCM_PATH=/opt/rocm export HSA_OVERRIDE_GFX_VERSION=10.3.0
Также убедитесь, что ваш текущий пользователь находится в группах пользователей render
и video
:
sudo usermod -aG render $USERNAME sudo usermod -aG video $USERNAME
Используйте следующую команду для запуска WebUI
python infer-web.py
Если вы ранее использовали Poetry для установки зависимостей, вы можете запустить WebUI следующим образом.
поэзия запускает python infer-web.py
Загрузите и разархивируйте RVC-beta.7z
Дважды щелкните файл go-web.bat
ш ./run.sh
источник /opt/intel/oneapi/setvars.sh