由於該項目的部署和使用,對於一些小白用戶來說,還是有一定的門檻,在此特別感謝錄咖(AI智能多媒體服務平台)網站基於該項目,提供的免費AI视频生成器
服務,可以不用部署,直接在線上使用,非常方便。
感謝佐糖https://picwish.cn 對此計畫的支持與贊助,使得該計畫能夠持續的更新與維護。
佐糖專注於影像處理領域,提供豐富的影像處理工具,將複雜操作極致簡化,真正實現讓影像處理更簡單。
API
和Web界面
1080x1920
1920x1080
字体
、位置
、颜色
、大小
,同時支援字幕描边
設置背景音乐音量
更真實的合成聲音 | ||
---|---|---|
demo-portrait-1.mp4 | default.mp4 | demo-portrait-2.mp4 |
demo-landscape.mp4 | demo-landscape-2.mp4 |
下載一鍵啟動包,解壓縮直接使用(路徑不要有中文、特殊字元、空白)
下載後,建議先雙擊執行update.bat
更新到最新程式碼,再雙擊start.bat
啟動
啟動後,會自動開啟瀏覽器(如果開啟是空白,建議換成Chrome或Edge開啟)
還沒製作一鍵啟動包,看下面的安裝部署部分,建議使用docker部署,更加方便。
全局流量
模式git clone https://github.com/harry0703/MoneyPrinterTurbo.git
config.example.toml
檔案複製一份,命名為config.toml
config.toml
檔案中的說明,設定好pexels_api_keys
和llm_provider
,並根據llm_provider 對應的服務商,設定相關的API Key若未安裝Docker,請先安裝https://www.docker.com/products/docker-desktop/
如果是Windows系統,請參考微軟的文件:
cd MoneyPrinterTurbo
docker-compose up
開啟瀏覽器,造訪http://0.0.0.0:8501
開啟瀏覽器,造訪http://0.0.0.0:8080/docs 或http://0.0.0.0:8080/redoc
影片教學
建議使用conda 建立python 虛擬環境
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
Windows:
配置文件config.toml
中的imagemagick_path
為你的實際安裝路徑MacOS:
brew install imagemagick
Ubuntu
sudo apt-get install imagemagick
CentOS
sudo yum install ImageMagick
注意需要到MoneyPrinterTurbo 專案根目录
下執行以下指令
conda activate MoneyPrinterTurbo
webui.bat
conda activate MoneyPrinterTurbo
sh webui.sh
啟動後,會自動開啟瀏覽器(如果開啟是空白,建議換成Chrome或Edge開啟)
python main.py
啟動後,可以查看API文档
http://127.0.0.1:8080/docs 或http://127.0.0.1:8080/redoc 直接在線調試接口,快速體驗。
所有支援的聲音列表,可以查看:聲音列表
2024-04-16 v1.1.2 新增了9種Azure的語音合成聲音,需要配置API KEY,此聲音合成的更加真實。
目前支援2種字幕生成方式:
速度快
,效能更好,對電腦配置沒有要求,但品質可能不穩定速度慢
,效能較差,對電腦配置有一定要求,但是质量更可靠
。可以修改config.toml
設定檔中的subtitle_provider
進行切換
建議使用edge
模式,如果產生的字幕品質不好,再切換到whisper
模式
注意:
由於國內無法存取HuggingFace,可以使用以下方法下載
whisper-large-v3
的模型文件
下載地址:
模型下載後解壓縮,整個目錄放到.MoneyPrinterTurbomodels
.MoneyPrinterTurbomodelswhisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
用於影片的背景音樂,位於專案的resource/songs
目錄下。
目前專案裡面放了一些預設的音樂,來自於YouTube 視頻,如有侵權,請刪除。
用於視訊字幕的渲染,位於專案的resource/fonts
目錄下,你也可以放進去自己的字體。
OpenAI宣布ChatGPT裡面3.5已經免費了,有開發者將其封裝成了API,可以直接呼叫
確保你安裝和啟動了docker服務,執行以下命令啟動docker服務
docker run -p 3040:3040 missuo/freegpt35
啟動成功後,修改config.toml
中的配置
llm_provider
設定為openai
openai_api_key
隨便填寫一個即可,例如'123456'openai_base_url
改為http://localhost:3040/v1/
openai_model_name
改為gpt-3.5-turbo
注意:該方式穩定性較差
這個問題是由於大模型沒有回傳正確的回應所導致的。
大概率是網路原因, 使用VPN ,或是設定openai_base_url
為你的代理,應該就可以解決了。
同時建議使用Moonshot或DeepSeek作為大模型供應商,這兩個服務商在國內訪問速度更快,更穩定。
通常情況下,ffmpeg 會被自動下載,並且會自動偵測到。 但是如果你的環境有問題,無法自動下載,可能會遇到以下錯誤:
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
此時你可以從https://www.gyan.dev/ffmpeg/builds/ 下載ffmpeg,解壓縮後,設定ffmpeg_path
為你的實際安裝路徑即可。
[ app ]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \
ffmpeg_path = " C: \ Users \ harry \ Downloads \ ffmpeg.exe "
可以在ImageMagick的設定檔policy.xml中找到這些策略。 這個檔案通常位於/etc/ImageMagick- X
/ 或ImageMagick 安裝目錄的類似位置。 修改包含pattern="@"
的條目,將rights="none"
更改為rights="read|write"
以允許對檔案的讀寫操作。
這個問題是由於系統開啟檔案數限制導致的,可以透過修改系統的檔案開啟數限制來解決。
查看當前限制
ulimit -n
如果過低,可以調高一些,例如
ulimit -n 10240
LocalEntryNotfoundEror: Cannot find an appropriate cached snapshotfolderfor the specified revision on the local disk and outgoing trafic has been disabled. To enablerepo look-ups and downloads online, passlocal sfiles's s.
或者
An error occured while synchronizing the model Systran/faster-whisper-large-v3 from the Hugging Face Hub: An error happened while trying to locate the files on the Hub and we cannot find the propriate for appropriate for yapp . Please check your internet connection and try again. Trying to load the model directly from the local cache, if it exists.
解決方法:點選查看如何從網盤手動下載模型
該專案基於https://github.com/FujiwaraChoki/MoneyPrinter 重建而來,做了大量的最佳化,增加了更多的功能。 感謝原作者的開源精神。
點擊查看LICENSE
文件