由于该项目的 部署 和 使用,对于一些小白用户来说,还是 有一定的门槛,在此特别感谢
录咖(AI智能 多媒体服务平台) 网站基于该项目,提供的免费AI视频生成器
服务,可以不用部署,直接在线使用,非常方便。
感谢佐糖 https://picwish.cn 对该项目的支持和赞助,使得该项目能够持续的更新和维护。
佐糖专注于图像处理领域,提供丰富的图像处理工具,将复杂操作极致简化,真正实现让图像处理更简单。
API
和 Web界面
1080x1920
1920x1080
字体
、位置
、颜色
、大小
,同时支持字幕描边
设置背景音乐音量
更真实的合成声音 |
||
---|---|---|
demo-portrait-1.mp4 |
default.mp4 |
demo-portrait-2.mp4 |
demo-landscape.mp4 |
demo-landscape-2.mp4 |
下载一键启动包,解压直接使用(路径不要有 中文、特殊字符、空格)
下载后,建议先双击执行 update.bat
更新到最新代码,然后双击 start.bat
启动
启动后,会自动打开浏览器(如果打开是空白,建议换成 Chrome 或者 Edge 打开)
还没有制作一键启动包,看下面的 安装部署 部分,建议使用 docker 部署,更加方便。
全局流量
模式git clone https://github.com/harry0703/MoneyPrinterTurbo.git
config.example.toml
文件复制一份,命名为 config.toml
config.toml
文件中的说明,配置好 pexels_api_keys
和 llm_provider
,并根据 llm_provider 对应的服务商,配置相关的
API Key如果未安装 Docker,请先安装 https://www.docker.com/products/docker-desktop/
如果是Windows系统,请参考微软的文档:
cd MoneyPrinterTurbo
docker-compose up
打开浏览器,访问 http://0.0.0.0:8501
打开浏览器,访问 http://0.0.0.0:8080/docs 或者 http://0.0.0.0:8080/redoc
视频教程
建议使用 conda 创建 python 虚拟环境
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
Windows:
配置文件 config.toml
中的 imagemagick_path
为你的 实际安装路径MacOS:
brew install imagemagick
Ubuntu
sudo apt-get install imagemagick
CentOS
sudo yum install ImageMagick
注意需要到 MoneyPrinterTurbo 项目 根目录
下执行以下命令
conda activate MoneyPrinterTurbo
webui.bat
conda activate MoneyPrinterTurbo
sh webui.sh
启动后,会自动打开浏览器(如果打开是空白,建议换成 Chrome 或者 Edge 打开)
python main.py
启动后,可以查看 API文档
http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接在线调试接口,快速体验。
所有支持的声音列表,可以查看:声音列表
2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。
当前支持2种字幕生成方式:
速度快
,性能更好,对电脑配置没有要求,但是质量可能不稳定速度慢
,性能较差,对电脑配置有一定要求,但是质量更可靠
。可以修改 config.toml
配置文件中的 subtitle_provider
进行切换
建议使用 edge
模式,如果生成的字幕质量不好,再切换到 whisper
模式
注意:
由于国内无法访问 HuggingFace,可以使用以下方法下载
whisper-large-v3
的模型文件
下载地址:
模型下载后解压,整个目录放到 .MoneyPrinterTurbomodels
里面,
最终的文件路径应该是这样: .MoneyPrinterTurbomodelswhisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
用于视频的背景音乐,位于项目的 resource/songs
目录下。
当前项目里面放了一些默认的音乐,来自于 YouTube 视频,如有侵权,请删除。
用于视频字幕的渲染,位于项目的 resource/fonts
目录下,你也可以放进去自己的字体。
OpenAI宣布ChatGPT里面3.5已经免费了,有开发者将其封装成了API,可以直接调用
确保你安装和启动了docker服务,执行以下命令启动docker服务
docker run -p 3040:3040 missuo/freegpt35
启动成功后,修改 config.toml
中的配置
llm_provider
设置为 openai
openai_api_key
随便填写一个即可,比如 '123456'openai_base_url
改为 http://localhost:3040/v1/
openai_model_name
改为 gpt-3.5-turbo
注意:该方式稳定性较差
这个问题是由于大模型没有返回正确的回复导致的。
大概率是网络原因, 使用 VPN,或者设置 openai_base_url
为你的代理 ,应该就可以解决了。
同时建议使用 Moonshot 或 DeepSeek 作为大模型提供商,这两个服务商在国内访问速度更快,更加稳定。
通常情况下,ffmpeg 会被自动下载,并且会被自动检测到。 但是如果你的环境有问题,无法自动下载,可能会遇到如下错误:
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
此时你可以从 https://www.gyan.dev/ffmpeg/builds/ 下载ffmpeg,解压后,设置 ffmpeg_path
为你的实际安装路径即可。
[app]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \
ffmpeg_path = "C:\Users\harry\Downloads\ffmpeg.exe"
可以在ImageMagick的配置文件policy.xml中找到这些策略。
这个文件通常位于 /etc/ImageMagick-X
/ 或 ImageMagick 安装目录的类似位置。
修改包含pattern="@"
的条目,将rights="none"
更改为rights="read|write"
以允许对文件的读写操作。
这个问题是由于系统打开文件数限制导致的,可以通过修改系统的文件打开数限制来解决。
查看当前限制
ulimit -n
如果过低,可以调高一些,比如
ulimit -n 10240
LocalEntryNotfoundEror: Cannot find an appropriate cached snapshotfolderfor the specified revision on the local disk and outgoing trafic has been disabled. To enablerepo look-ups and downloads online, pass 'local files only=False' as input.
或者
An error occured while synchronizing the model Systran/faster-whisper-large-v3 from the Hugging Face Hub: An error happened while trying to locate the files on the Hub and we cannot find the appropriate snapshot folder for the specified revision on the local disk. Please check your internet connection and try again. Trying to load the model directly from the local cache, if it exists.
解决方法:点击查看如何从网盘手动下载模型
该项目基于 https://github.com/FujiwaraChoki/MoneyPrinter 重构而来,做了大量的优化,增加了更多的功能。 感谢原作者的开源精神。
点击查看 LICENSE
文件