GUI definitiva para eliminar voces v5.6
Acerca de
Esta aplicación utiliza modelos de separación de fuentes de última generación para eliminar voces de archivos de audio. Los desarrolladores principales de UVR entrenaron todos los modelos proporcionados en este paquete (excepto los modelos de 4 vástagos Demucs v3 y v4).
Instalación
Estos paquetes contienen la interfaz UVR, Python, PyTorch y otras dependencias necesarias para ejecutar la aplicación de forma eficaz. No se requieren requisitos previos.
Instalación de Windows
Tenga en cuenta:
- Este instalador está destinado a quienes ejecutan Windows 10 o superior.
- No se garantiza la funcionalidad de la aplicación para sistemas que ejecutan Windows 7 o versiones anteriores.
- No se garantiza la funcionalidad de la aplicación para sistemas de CPU Intel Pentium y Celeron.
- Debe instalar UVR en la unidad principal C:. La instalación de UVR en una unidad secundaria provocará inestabilidad.
Descargue el instalador de UVR para Windows a través del siguiente enlace:
- Enlace de descarga principal
- Espejo del enlace de descarga principal
Si utilizas una tarjeta gráfica AMD Radeon o Intel Arc , puedes probar la versión OpenCL:
- Versión OpenCL - Enlace de descarga principal
Instrucciones del paquete de actualización para aquellos que ya tienen UVR instalado:
- Si ya tiene UVR instalado, puede instalar este paquete sobre él o descargarlo directamente desde la aplicación o hacer clic aquí para obtener el parche.
Instalación manual de Windows
Instalación manual de Windows
- Descargue y extraiga el repositorio aquí
- Descargue e instale Python aquí
- Asegúrese de marcar "Agregar python.exe a la RUTA" durante la instalación
- Ejecute los siguientes comandos desde el directorio del repositorio extraído:
python.exe -m pip install -r requirements.txt
Si tiene una GPU Nvidia compatible, ejecute el siguiente comando:
python.exe -m pip install --upgrade torch --extra-index-url https://download.pytorch.org/whl/cu117
Si no tiene instalado FFmpeg o Rubber Band y desea evitar pasar por el proceso de instalación durante mucho tiempo, siga las instrucciones a continuación.
Instalación de FFmpeg
- Descargue la compilación precompilada aquí
- Del archivo, extraiga el siguiente archivo al directorio de la aplicación UVR:
-
ffmpeg-5.1.2-essentials_build/bin/ffmpeg.exe
Instalación de banda elástica
Para utilizar la herramienta Time Stretch o Change Pitch, necesitarás una banda elástica.
- Descargue la compilación precompilada aquí
- Del archivo, extraiga los siguientes archivos al directorio de la aplicación UVR:
-
rubberband-3.1.2-gpl-executable-windows/rubberband.exe
-
rubberband-3.1.2-gpl-executable-windows/sndfile.dll
Instalación de Mac OS
Usuarios de MacOS: ¿Tienen problemas para abrir UVR?
Debido a la estricta seguridad de las aplicaciones de Apple, es posible que deba seguir estos pasos para abrir UVR.
Primero, ejecute el siguiente comando a través de Terminal.app para permitir que las aplicaciones se ejecuten desde todas las fuentes (se recomienda volver a habilitarlo una vez que UVR se abra correctamente).
sudo spctl --master-disable
En segundo lugar, ejecute el siguiente comando para evitar la notarización:
sudo xattr -rd com.apple.quarantine /Applications/Ultimate Vocal Remover.app
Instalación manual de MacOS
Instalación manual de MacOS
- Descargue y guarde este repositorio aquí
- Descargue e instale Python 3.10 aquí
- Desde el directorio guardado ejecute lo siguiente:
pip3 install -r requirements.txt
- Si su Mac se ejecuta con un M1, ejecute el siguiente comando a continuación. Si no, omita este paso. -
cp /Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/site-packages/_soundfile_data/libsndfile_arm64.dylib /Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/site-packages/_soundfile_data/libsndfile.dylib
Instalación de FFmpeg
- Una vez que haya terminado con la instalación, descargue aquí el binario FFmpeg correcto para su sistema y colóquelo en el directorio principal de la aplicación.
Instalación de banda elástica
Para utilizar la herramienta Time Stretch o Change Pitch, necesitarás una banda elástica.
- Descargue la compilación precompilada aquí
- Del archivo, extraiga los siguientes archivos al directorio de la aplicación UVR/lib_v5:
-
rubberband-3.1.2-gpl-executable-macos/rubberband
Este proceso se probó en una MacBook Pro 2021 (usando M1) y una MacBook Air 2017 y se confirma que funciona en ambas.
Instalación de Linux
Consulte las instrucciones de instalación de Linux.
Estas instrucciones de instalación son para sistemas Linux basados en Debian y Arch.
- Descargue y guarde este repositorio aquí
- Desde el directorio guardado, ejecute los siguientes comandos en este orden:
Para sistemas basados en Debian (Ubuntu, Mint, etc.):
sudo apt update && sudo apt upgrade
sudo apt-get update
sudo apt install ffmpeg
sudo apt install python3-pip
sudo apt-get -y install python3-tk
pip3 install -r requirements.txt
python3 UVR.py
Para basado en Arch (EndeavourOS):
sudo pacman -Syu
sudo pacman -Sy
sudo pacman -S python-pip
sudo pacman -S --noconfirm tk
sudo pacman -S ffmpeg
Para omitir la configuración del entorno y continuar con la instalación, use:
- Tenga cuidado; esto modifica los archivos del sistema.
sudo rm /usr/lib/python3.11/EXTERNALLY-MANAGED
Luego proceda con lo siguiente en orden:
chmod +x install_packages.sh
./install_packages.sh
python UVR.py
Otras notas de aplicación
- Nvidia RTX 1060 6GB es el requisito mínimo para las conversiones de GPU.
- Se recomiendan GPU Nvidia con al menos 8 GB de V-RAM.
- La compatibilidad con GPU AMD Radeon es limitada en este momento.
- Actualmente hay una rama en funcionamiento para usuarios de GPU AMD aquí.
- Esta aplicación sólo es compatible con plataformas de 64 bits.
- Esta aplicación se basa en la biblioteca Rubber Band para las opciones Time-Stretch y Pitch-Shift.
- Esta aplicación se basa en FFmpeg para procesar archivos de audio que no son WAV.
- La aplicación recordará automáticamente su configuración cuando se cierre.
- Los tiempos de conversión dependerán significativamente de su hardware.
- Estos modelos son computacionalmente intensivos.
Actuación:
- Los tiempos de carga del modelo son más rápidos.
- Importar/exportar archivos de audio es más rápido.
Solución de problemas
Problemas comunes
- Si FFmpeg no está instalado, la aplicación generará un error si el usuario intenta convertir un archivo que no sea WAV.
- Los errores de asignación de memoria generalmente se pueden resolver reduciendo los tamaños de "Segmento" o "Ventana".
Error al hacer clic izquierdo en MacOS Sonoma
Hay un problema conocido en MacOS Sonoma donde los clics izquierdos no se registran correctamente dentro de la aplicación. Esto estaba afectando a todas las aplicaciones creadas con Tkinter en Sonoma y desde entonces se ha resuelto. Descargue la última versión a través del siguiente enlace si aún tiene problemas: enlace
Este problema se estaba rastreando aquí.
Informe de problemas
Sea lo más detallado posible cuando publique un nuevo número.
Si es posible, haga clic en el "Botón de configuración" a la izquierda del botón "Iniciar procesamiento" y haga clic en el botón "Registro de errores" para obtener información detallada sobre los errores que se nos puede proporcionar.
Licencia
El código GUI de Ultimate Vocal Remover tiene licencia MIT.
- Tenga en cuenta: Para todos los desarrolladores de aplicaciones de terceros que deseen utilizar nuestros modelos, respete la licencia del MIT brindando crédito a UVR y sus desarrolladores.
Créditos
- ZFTurbo: creó y entrenó los pesos para los nuevos modelos MDX23C.
- DilanBoskan: Sus contribuciones al inicio de este proyecto fueron esenciales para el éxito de UVR. ¡Gracias!
- Bas Curtiz: diseñó el logotipo, el ícono, el banner y la pantalla de presentación oficiales de UVR.
- tsurumeso: desarrolló el código de arquitectura de realidad virtual original.
- Kuielab y Woosung Choi: desarrollaron el código AI MDX-Net original.
- Adefossez & Demucs: desarrollaron el código de IA original de Demucs.
- KimberleyJSN: asesoró y ayudó en la implementación de los scripts de capacitación para MDX-Net y Demucs. ¡Gracias!
- Hv: ayudó a implementar fragmentos en el código MDX-Net AI. ¡Gracias!
Contribuyendo
- Para cualquier persona interesada en el desarrollo continuo de la GUI de Ultimate Vocal Remover , envíenos una solicitud de extracción y la revisaremos.
- Este proyecto es 100% de código abierto y gratuito para que cualquiera pueda usarlo y modificarlo como desee.
- Solo mantenemos el desarrollo y soporte para la GUI de Ultimate Vocal Remover y los modelos proporcionados.
Referencias
- [1] Takahashi et al., "DenseNets multibanda y escala múltiple para la separación de fuentes de audio", https://arxiv.org/pdf/1706.09588.pdf