Примечание. Я не планирую активно работать над улучшениями/улучшениями этого проекта, это в основном предназначено для поддержания репозитория в рабочем состоянии на случай, если исходный git.ecker выйдет из строя или необходимо внести необходимые изменения в пакет.
При этом были добавлены некоторые улучшения по сравнению с исходным репозиторием:
✔️ Возможно обучение на других языках
✔️ Добавлен Хифиган, позволяющий быстрее делать выводы за счет качества.
✔️ шепот-v3 добавлен в качестве опции для выбора для шепота
✔️ Преобразование вывода с использованием RVC
Это форк репозитория, который изначально находился здесь: https://git.ecker.tech/mrq/ai-voice-cloning. Вся работа, которая была вложена в него для включения обучения с помощью DLAS и вывода с помощью Tortoise, принадлежит mrq, автору оригинального репозитория для клонирования голоса ai-voice.
Этот репозиторий работает в Windows с графическими процессорами NVIDIA и в Linux с Docker с графическими процессорами NVIDIA .
start.bat
Если вы устанавливаете это вручную, вам понадобится:
git clone https://github.com/JarodMica/ai-voice-cloning.git
setup-cuda.bat
, и он начнет работать со всеми необходимыми пакетами Python.start.bat
, и начнется загрузка большинства необходимых вам моделей.models
в корне.setup-whipserx.bat
Убедитесь, что установлены последние версии драйверов NVIDIA: sudo ubuntu-drivers install
Установите Docker удобным вам способом. Один из способов сделать это — следовать официальной документации здесь.
Если при запуске докера для голосового клонирования появляется сообщение об ошибке, в котором говорится, что графический процессор не может быть использован, возможно, вам придется установить Nvidia Docker Container Toolkit.
Установить методом «apt»
Запустите команду настройки докера.
sudo nvidia-ctk runtime configure --runtime=docker
Перезапустить докер
Убедитесь, что ваши драйверы Nvidia обновлены: https://www.nvidia.com/download/index.aspx
wsl --install
и перезапустите.ubuntu
. Теперь он должен загрузить вас в wsl2.sudo apt-key del 7fa2af80
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-4
ubuntu
и следуйте инструкциям ниже. git clone https://github.com/JarodMica/ai-voice-cloning.git && cd ai-voice-cloning
./setup-docker.sh
./start-docker.sh
http://localhost:7860
или удаленно с помощью http://<ip>:7860
Если удаленный сервер недоступен, проверьте эту тему
Вам также может потребоваться переназначить локальные папки на папки Docker. Для этого необходимо открыть скрипт start-docker.sh и обновить некоторые строки. Например, если вы хотите легко найти сгенерированные аудио, создайте папку «results» в корневом каталоге, а затем в «start-docker.sh» добавьте строку:
-v "your/custom/path:/home/user/ai-voice-cloning/results"
Посмотрите видео на YouTube:
Сначала посмотрите: https://youtu.be/WWhNqJEmF9M?si=RhUZhYersAvSZ4wf
Смотреть второе (обновление RVC): https://www.youtube.com/watch?v=7tpWH8_S8es&t=504s
Все практически так же, как и раньше, если вы использовали этот репозиторий раньше, однако появилась новая опция для преобразования текстового вывода с помощью rvc
. Прежде чем вы сможете его использовать, вам понадобится обученный файл RVC .pth, который вы получите из RVC или онлайн, а затем вам нужно будет поместить его в models/rvc_models/
. Здесь можно разместить файлы .index и .pth, и они будут правильно отображаться в соответствующих раскрывающихся меню.
Чтобы включить RVC:
Show Experimental Settings
чтобы открыть дополнительные параметры.Run the outputter audio through RVC
. Теперь у вас будет доступ к параметрам, которые вы можете настроить в RVC для используемой вами модели голоса RVC. Ниже описано, как обновить пакет до последних обновлений.
ПРИМЕЧАНИЕ. Если произошли серьезные изменения функций, проверьте последнюю версию, чтобы узнать, будет ли работать
update_package.bat
. Если НЕТ, вам придется повторно загрузить и повторно извлечь пакет из Hugging Face.
update_package.bat
У вас должна быть возможность перейти в папку, а затем извлечь репозиторий, чтобы обновить его.
cd ai-voice-cloning
git pull
Если добавлены большие функции, вам может потребоваться удалить venv и повторно запустить сценарий setup-cuda, чтобы убедиться в отсутствии проблем с пакетом.
У вас должна быть возможность перейти в папку, а затем извлечь репозиторий, чтобы обновить его, а затем восстановить образ Docker.
cd ai-voice-cloning
git pull
./setup-docker.sh
Терминал — ваш друг. Любые ошибки или проблемы будут появляться в терминале, когда вы попытаетесь запустить его, а затем оттуда можно будет начать отладку.
.venvScriptsactivate.bat
pip uninstall torch
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
Если у вас возникнут какие-либо проблемы, откройте новую проблему на вкладке «Проблемы».
setup-cuda.bat
должен содержать все необходимое для установки пакетов. Все различные файлы требований создают беспорядок в сценарии, но в каждом репозитории установлены свои требования, а затем, в конце, файл requirements.txt
в корне необходим для изменения версии обратно на совместимые версии для этого репозитория.