En raison du déploiement et de l'utilisation de ce projet, il existe encore un certain seuil pour certains utilisateurs novices. Je voudrais exprimer mes remerciements particuliers au site Web Luka (AI Intelligent Multimedia Service Platform) pour avoir fourni des services gratuits AI视频生成器
basés sur ce projet. Aucun déploiement requis, utilisez-le simplement en ligne, ce qui est très pratique.
Merci à Zuotang https://picwish.cn pour avoir soutenu et sponsorisé ce projet, ce qui permet au projet d'être continuellement mis à jour et maintenu.
Zuotang se concentre sur le domaine du traitement d'image et fournit une multitude d' outils de traitement d'image pour simplifier extrêmement les opérations complexes et réellement simplifier le traitement d'image.
API
et Web界面
1080x1920
1920x1080
字体
,位置
,颜色
,大小
et prend en charge les paramètres字幕描边
. 背景音乐音量
peut être réglé Des sons synthétisés plus réalistes | ||
---|---|---|
démo-portrait-1.mp4 | par défaut.mp4 | démo-portrait-2.mp4 |
démo-paysage.mp4 | démo-paysage-2.mp4 |
Téléchargez le package de démarrage en un clic, décompressez-le et utilisez-le directement (le chemin ne doit pas contenir de caractères chinois , de caractères spéciaux ou d'espaces )
Après le téléchargement, il est recommandé de double-cliquer sur update.bat
pour mettre à jour vers le dernier code , puis de double-cliquer sur start.bat
pour démarrer.
Après le démarrage, le navigateur s'ouvrira automatiquement (s'il s'ouvre vide, il est recommandé de l'ouvrir dans Chrome ou Edge )
Le package de démarrage en un clic n'a pas encore été créé. Voir la section d'installation et de déploiement ci-dessous. Il est recommandé d'utiliser le déploiement Docker , ce qui est plus pratique.
全局流量
. git clone https://github.com/harry0703/MoneyPrinterTurbo.git
config.example.toml
et nommez- config.toml
config.toml
pour configurer pexels_api_keys
et llm_provider
, et configurez la clé API appropriée en fonction du fournisseur de services correspondant à llm_provider.Si Docker n'est pas installé, veuillez d'abord l'installer https://www.docker.com/products/docker-desktop/
S'il s'agit d'un système Windows, veuillez vous référer à la documentation de Microsoft :
cd MoneyPrinterTurbo
docker-compose up
Ouvrez le navigateur et visitez http://0.0.0.0:8501
Ouvrez le navigateur et visitez http://0.0.0.0:8080/docs ou http://0.0.0.0:8080/redoc
Tutoriel vidéo
Il est recommandé d'utiliser conda pour créer un environnement virtuel python
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
Fenêtres :
imagemagick_path
dans配置文件config.toml
par votre chemin d'installation réelMac OS :
brew install imagemagick
Ubuntu
sudo apt-get install imagemagick
CentOS
sudo yum install ImageMagick
Notez que vous devez exécuter la commande suivante dans根目录
du projet MoneyPrinterTurbo
conda activate MoneyPrinterTurbo
webui.bat
conda activate MoneyPrinterTurbo
sh webui.sh
Après le démarrage, le navigateur s'ouvrira automatiquement (s'il s'ouvre vide, il est recommandé de l'ouvrir dans Chrome ou Edge )
python main.py
Après le démarrage, vous pouvez consulter API文档
http://127.0.0.1:8080/docs ou http://127.0.0.1:8080/redoc pour déboguer directement l'interface en ligne pour une expérience rapide.
Pour une liste de tous les sons pris en charge, vous pouvez consulter : Liste des sons
2024-04-16 v1.1.2 ajoute 9 nouveaux sons de synthèse vocale Azure, qui doivent être configurés avec API KEY. Les sons synthétisés sont plus réalistes.
Actuellement, 2 méthodes de génération de sous-titres sont prises en charge :
速度快
, meilleures performances, aucune exigence de configuration informatique, mais la qualité peut être instable速度慢
, les performances sont médiocres et nécessitent une certaine configuration informatique, mais质量更可靠
. Vous pouvez modifier subtitle_provider
dans le fichier de configuration config.toml
pour basculer
Il est recommandé d'utiliser le mode edge
. Si la qualité des sous-titres générés n'est pas bonne, passez en mode whisper
.
Avis:
Étant donné que HuggingFace n'est pas accessible en Chine, vous pouvez utiliser la méthode suivante pour télécharger le fichier modèle de
whisper-large-v3
Adresse de téléchargement :
Après avoir téléchargé le modèle, décompressez-le et placez le répertoire entier dans .MoneyPrinterTurbomodels
. Le chemin final du fichier devrait ressembler à ceci : .MoneyPrinterTurbomodelswhisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
La musique de fond utilisée pour les vidéos se trouve dans le répertoire resource/songs
du projet.
Le projet actuel contient de la musique par défaut provenant de vidéos YouTube. En cas d'infraction, veuillez la supprimer.
Il est utilisé pour le rendu des sous-titres vidéo et se trouve dans le répertoire resource/fonts
du projet. Vous pouvez également y mettre vos propres polices.
OpenAI a annoncé que ChatGPT 3.5 est désormais gratuit. Certains développeurs l'ont encapsulé dans une API pouvant être appelée directement.
Assurez-vous d'avoir installé et démarré le service Docker , exécutez la commande suivante pour démarrer le service Docker
docker run -p 3040:3040 missuo/freegpt35
Après un démarrage réussi, modifiez la configuration dans config.toml
llm_provider
est configuré pour openai
openai_api_key
, tel que '123456'openai_base_url
a été remplacé http://localhost:3040/v1/
openai_model_name
a été remplacé par gpt-3.5-turbo
Remarque : Cette méthode est moins stable
Ce problème est dû au fait que les modèles volumineux ne renvoient pas de réponses correctes.
Il y a une forte probabilité que cela soit dû au réseau. L'utilisation d'un VPN ou la définition de openai_base_url
comme proxy devrait résoudre le problème.
Il est également recommandé d'utiliser Moonshot ou DeepSeek en tant que grand fournisseur de services. Ces deux fournisseurs de services ont un accès plus rapide et plus stable en Chine.
Normalement, ffmpeg est automatiquement téléchargé et automatiquement détecté. Mais s'il y a un problème avec votre environnement et que le téléchargement automatique ne peut pas avoir lieu, vous pouvez rencontrer l'erreur suivante :
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
À ce stade, vous pouvez télécharger ffmpeg depuis https://www.gyan.dev/ffmpeg/builds/ Après la décompression, définissez ffmpeg_path
sur votre chemin d'installation réel.
[ app ]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \
ffmpeg_path = " C: \ Users \ harry \ Downloads \ ffmpeg.exe "
Ces politiques peuvent être trouvées dans le fichier de configuration d'ImageMagick Policy.xml. Ce fichier se trouve généralement dans /etc/ImageMagick- X
/ ou dans un emplacement similaire dans le répertoire d'installation d'ImageMagick. Modifiez l'entrée contenant pattern="@"
et remplacez rights="none"
par rights="read|write"
pour autoriser la lecture et l'écriture du fichier.
Ce problème est dû à la limite du système sur le nombre de fichiers ouverts et peut être résolu en modifiant la limite du système sur le nombre de fichiers ouverts.
Afficher les limites actuelles
ulimit -n
S'il est trop bas, vous pouvez l'ajuster plus haut, par exemple
ulimit -n 10240
LocalEntryNotfoundEror : Impossible de trouver un dossier d'instantanés mis en cache approprié pour la révision spécifiée sur le disque local et le trafic sortant a été désactivé. Pour activer les recherches et les téléchargements de dépôt en ligne, transmettez « fichiers locaux uniquement = False » en entrée.
ou
Une erreur s'est produite lors de la synchronisation du modèle Systran/faster-whisper-large-v3 à partir du Hugging Face Hub : une erreur s'est produite lors de la tentative de localisation des fichiers sur le Hub et nous ne pouvons pas trouver le dossier d'instantanés approprié pour la révision spécifiée sur le disque local. . Veuillez vérifier votre connexion Internet et réessayer de charger le modèle directement à partir du cache local, s'il existe.
Solution : Cliquez pour voir comment télécharger manuellement le modèle à partir du disque réseau.
Ce projet est refactorisé sur la base de https://github.com/FujiwaraChoki/MoneyPrinter Il a apporté de nombreuses optimisations et ajouté plus de fonctions. Merci à l'auteur original pour son esprit open source.
Cliquez pour voir le fichier LICENSE