Debido a la implementación y el uso de este proyecto, todavía existe un cierto umbral para algunos usuarios novatos. Me gustaría expresar mi agradecimiento especial al sitio web Luka (AI Intelligent Multimedia Service Platform) por proporcionar servicios gratuitos AI视频生成器
basados en este proyecto. No se requiere implementación, solo úselo en línea, lo cual es muy conveniente.
Gracias a Zuotang https://picwish.cn por apoyar y patrocinar este proyecto, lo que permite que se actualice y mantenga continuamente.
Zuotang se centra en el campo del procesamiento de imágenes y proporciona una gran cantidad de herramientas de procesamiento de imágenes para simplificar extremadamente las operaciones complejas y realmente simplificar el procesamiento de imágenes.
API
e Web界面
1080x1920
1920x1080
字体
,位置
,颜色
,大小
y admite la configuración字幕描边
. 背景音乐音量
Sonidos sintetizados más realistas | ||
---|---|---|
retrato-demo-1.mp4 | predeterminado.mp4 | retrato-de-mostración-2.mp4 |
paisaje-demo.mp4 | demo-paisaje-2.mp4 |
Descargue el paquete de inicio con un solo clic, descomprímalo y úselo directamente (la ruta no debe contener caracteres chinos , caracteres especiales o espacios )
Después de la descarga, se recomienda hacer doble clic en update.bat
para actualizar al código más reciente y luego hacer doble clic en start.bat
para comenzar.
Después del inicio, el navegador se abrirá automáticamente (si se abre en blanco, se recomienda abrirlo en Chrome o Edge )
El paquete de inicio con un clic aún no se ha creado. Consulte la sección de instalación e implementación a continuación. Se recomienda utilizar la implementación de Docker , que es más conveniente.
全局流量
. git clone https://github.com/harry0703/MoneyPrinterTurbo.git
config.example.toml
y asígnele el nombre config.toml
config.toml
para configurar pexels_api_keys
y llm_provider
, y configure la clave API relevante de acuerdo con el proveedor de servicios correspondiente a llm_provider.Si Docker no está instalado, instálelo primero https://www.docker.com/products/docker-desktop/
Si es un sistema Windows, consulte la documentación de Microsoft:
cd MoneyPrinterTurbo
docker-compose up
Abra el navegador y visite http://0.0.0.0:8501
Abra el navegador y visite http://0.0.0.0:8080/docs o http://0.0.0.0:8080/redoc
Vídeotutorial
Se recomienda utilizar conda para crear un entorno virtual de Python.
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
Ventanas:
imagemagick_path
en配置文件config.toml
a su ruta de instalación realMac OS:
brew install imagemagick
ubuntu
sudo apt-get install imagemagick
CentOS
sudo yum install ImageMagick
Tenga en cuenta que debe ejecutar el siguiente comando en根目录
del proyecto MoneyPrinterTurbo
conda activate MoneyPrinterTurbo
webui.bat
conda activate MoneyPrinterTurbo
sh webui.sh
Después del inicio, el navegador se abrirá automáticamente (si se abre en blanco, se recomienda abrirlo en Chrome o Edge )
python main.py
Después del inicio, puede ver API文档
http://127.0.0.1:8080/docs o http://127.0.0.1:8080/redoc para depurar directamente la interfaz en línea y disfrutar de una experiencia rápida.
Para obtener una lista de todos los sonidos admitidos, puede ver: Lista de sonidos
2024-04-16 v1.1.2 agrega 9 nuevos sonidos de síntesis de voz de Azure, que deben configurarse con API KEY. Los sonidos sintetizados son más realistas.
Actualmente, se admiten 2 métodos de generación de subtítulos:
速度快
, mejor rendimiento, sin requisitos de configuración de la computadora, pero la calidad puede ser inestable速度慢
, el rendimiento es deficiente y requiere cierta configuración de la computadora, pero质量更可靠
. Puede modificar subtitle_provider
en el archivo de configuración config.toml
para cambiar
Se recomienda utilizar el modo edge
. Si la calidad de los subtítulos generados no es buena, cambie al modo whisper
.
Aviso:
Dado que no se puede acceder a HuggingFace en China, puede utilizar el siguiente método para descargar el archivo modelo de
whisper-large-v3
Dirección de descarga:
Después de descargar el modelo, descomprímalo y coloque el directorio completo en .MoneyPrinterTurbomodels
. La ruta del archivo final debería ser así: .MoneyPrinterTurbomodelswhisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
La música de fondo utilizada para los videos se encuentra en el directorio resource/songs
del proyecto.
El proyecto actual contiene música predeterminada de videos de YouTube. Si hay alguna infracción, elimínela.
Se utiliza para renderizar subtítulos de vídeo y se encuentra en el directorio de resource/fonts
del proyecto. También puedes poner tus propias fuentes en él.
OpenAI anunció que ChatGPT 3.5 ahora es gratuito. Algunos desarrolladores lo han encapsulado en una API a la que se puede llamar directamente.
Asegúrese de haber instalado e iniciado el servicio Docker , ejecute el siguiente comando para iniciar el servicio Docker.
docker run -p 3040:3040 missuo/freegpt35
Después de un inicio exitoso, modifique la configuración en config.toml
llm_provider
está configurado en openai
openai_api_key
, como '123456'openai_base_url
cambió http://localhost:3040/v1/
openai_model_name
cambió a gpt-3.5-turbo
Nota: este método es menos estable.
Este problema se debe a que los modelos grandes no devuelven respuestas correctas.
Existe una alta probabilidad de que sea causado por la red. Usar una VPN o configurar openai_base_url
como proxy debería resolver el problema.
También se recomienda utilizar Moonshot o DeepSeek como proveedor de modelos grandes. Estos dos proveedores de servicios tienen un acceso más rápido y estable en China.
Normalmente, ffmpeg se descarga y detecta automáticamente. Pero si hay un problema con su entorno y no se puede realizar la descarga automática, puede encontrar el siguiente error:
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
En este momento, puede descargar ffmpeg desde https://www.gyan.dev/ffmpeg/builds/. Después de descomprimirlo, configure ffmpeg_path
en su ruta de instalación real.
[ app ]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \
ffmpeg_path = " C: \ Users \ harry \ Downloads \ ffmpeg.exe "
Estas políticas se pueden encontrar en el archivo de configuración de ImageMagick Policy.xml. Este archivo normalmente se encuentra en /etc/ImageMagick- X
/ o una ubicación similar en el directorio de instalación de ImageMagick. Modifique la entrada que contiene pattern="@"
y cambie rights="none"
a rights="read|write"
para permitir la lectura y escritura del archivo.
Este problema es causado por el límite del sistema en la cantidad de archivos abiertos y se puede resolver modificando el límite del sistema en la cantidad de archivos abiertos.
Ver límites actuales
ulimit -n
Si es demasiado bajo, puedes ajustarlo más alto, por ejemplo.
ulimit -n 10240
LocalEntryNotfoundEror: no se puede encontrar una carpeta de instantáneas en caché adecuada para la revisión especificada en el disco local y el tráfico saliente se ha deshabilitado para habilitar las búsquedas y descargas de repositorios en línea, pase 'solo archivos locales = Falso' como entrada.
o
Se produjo un error al sincronizar el modelo Systran/faster-whisper-large-v3 desde Hugging Face Hub: se produjo un error al intentar ubicar los archivos en el Hub y no podemos encontrar la carpeta de instantáneas adecuada para la revisión especificada en el disco local. Verifique su conexión a Internet e inténtelo nuevamente. Intenta cargar el modelo directamente desde el caché local, si existe.
Solución: haga clic para ver cómo descargar manualmente el modelo desde el disco de red.
Este proyecto está refactorizado en base a https://github.com/FujiwaraChoki/MoneyPrinter. Se han realizado muchas optimizaciones y se han agregado más funciones. Gracias al autor original por su espíritu de código abierto.
Haga clic para ver el archivo LICENSE