เนื่องจาก การปรับใช้ และ การใช้ งานโปรเจ็กต์นี้ ยังคงมีเกณฑ์ที่แน่นอน สำหรับผู้ใช้มือใหม่บางคน ฉันอยาก จะแสดงความขอบคุณเป็นพิเศษต่อเว็บไซต์ Luka (AI Intelligent Multimedia Service Platform) ที่ให้บริการ AI视频生成器
ฟรีตามโปรเจ็กต์นี้ . ไม่ต้อง Deploy แค่ใช้งานออนไลน์ก็สะดวกมาก
ขอขอบคุณ Zuotang https://picwish.cn สำหรับการสนับสนุนและสนับสนุนโครงการนี้ ซึ่งทำให้โครงการได้รับการอัปเดตและบำรุงรักษาอย่างต่อเนื่อง
Zuotang มุ่งเน้นไปที่ ด้านการประมวลผลภาพ และมอบ เครื่องมือการประมวลผลภาพ มากมาย เพื่อลดความซับซ้อนของการดำเนินการอย่างมาก และทำให้การประมวลผลภาพง่ายขึ้นอย่างแท้จริง
API
และ Web界面
1080x1920
1920x1080
字体
位置
颜色
大小
และรองรับการตั้ง字幕描边
背景音乐音量
ได้ เสียงสังเคราะห์ที่สมจริงยิ่งขึ้น | ||
---|---|---|
การสาธิตแนวตั้ง-1.mp4 | ค่าเริ่มต้น.mp4 | การสาธิตแนวตั้ง-2.mp4 |
สาธิต-landscape.mp4 | การสาธิตแนวนอน-2.mp4 |
ดาวน์โหลดแพ็คเกจเริ่มต้นเพียงคลิกเดียว แตกไฟล์แล้วใช้งานได้โดยตรง (เส้นทางไม่ควรมีตัวอักษร จีน อักขระพิเศษ หรือ การเว้นวรรค )
หลังจากดาวน์โหลด ขอแนะนำ ให้ดับเบิลคลิก update.bat
เพื่ออัปเดตเป็น โค้ดล่าสุด จากนั้นดับเบิลคลิก start.bat
เพื่อเริ่มต้น
หลังจากเริ่มต้นเบราว์เซอร์จะเปิดขึ้นโดยอัตโนมัติ (หากเปิดว่างแนะนำให้เปิดใน Chrome หรือ Edge )
ยังไม่ได้สร้างแพ็คเกจเริ่มต้นแบบคลิกเดียว ดูส่วน การติดตั้งและการปรับใช้ ด้านล่าง ขอแนะนำให้ใช้การปรับใช้ นักเทียบท่า ซึ่งสะดวกกว่า
全局流量
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
config.example.toml
และตั้งชื่อเป็น config.toml
config.toml
เพื่อกำหนดค่า pexels_api_keys
และ llm_provider
และกำหนดค่าคีย์ API ที่เกี่ยวข้องตามผู้ให้บริการที่สอดคล้องกับ llm_providerหากไม่ได้ติดตั้ง Docker โปรดติดตั้งก่อน https://www.docker.com/products/docker-desktop/
หากเป็นระบบ Windows โปรดดูเอกสารประกอบของ Microsoft:
cd MoneyPrinterTurbo
docker-compose up
เปิดเบราว์เซอร์และไปที่ http://0.0.0.0:8501
เปิดเบราว์เซอร์และไปที่ http://0.0.0.0:8080/docs หรือ http://0.0.0.0:8080/redoc
วิดีโอสอน
ขอแนะนำให้ใช้ conda เพื่อสร้างสภาพแวดล้อมเสมือนของ Python
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
หน้าต่าง:
imagemagick_path
ใน配置文件config.toml
เป็น เส้นทางการติดตั้งจริง ของคุณแมคโอเอส:
brew install imagemagick
อูบุนตู
sudo apt-get install imagemagick
CentOS
sudo yum install ImageMagick
โปรดทราบว่าคุณต้องดำเนินการคำสั่งต่อไปนี้ใน根目录
ของโปรเจ็กต์ MoneyPrinterTurbo
conda activate MoneyPrinterTurbo
webui.bat
conda activate MoneyPrinterTurbo
sh webui.sh
หลังจากเริ่มต้นเบราว์เซอร์จะเปิดขึ้นโดยอัตโนมัติ (หากเปิดว่างแนะนำให้เปิดใน Chrome หรือ Edge )
python main.py
หลังจากเริ่มต้น คุณสามารถดู API文档
http://127.0.0.1:8080/docs หรือ http://127.0.0.1:8080/redoc เพื่อดีบักอินเทอร์เฟซออนไลน์โดยตรงเพื่อประสบการณ์ที่รวดเร็ว
สำหรับรายการเสียงที่รองรับทั้งหมด คุณสามารถดู: รายการเสียง
16-04-2024 v1.1.2 เพิ่มเสียงการสังเคราะห์เสียงพูดของ Azure ใหม่ 9 เสียง ซึ่งจำเป็นต้องกำหนดค่าด้วย API KEY เสียงที่สังเคราะห์ขึ้นจะสมจริงยิ่งขึ้น
ปัจจุบันรองรับวิธีการสร้างคำบรรยาย 2 วิธี:
速度快
ประสิทธิภาพที่ดีขึ้น ไม่มีข้อกำหนดในการกำหนดค่าคอมพิวเตอร์ แต่คุณภาพอาจไม่เสถียร速度慢
ประสิทธิภาพต่ำ และต้องมีการกำหนดค่าคอมพิวเตอร์บางอย่าง แต่质量更可靠
คุณสามารถแก้ไข subtitle_provider
ในไฟล์การกำหนดค่า config.toml
เพื่อสลับได้
ขอแนะนำให้ใช้โหมด edge
หากคุณภาพของคำบรรยายที่สร้างขึ้นไม่ดี ให้เปลี่ยนไปใช้โหมด whisper
สังเกต:
เนื่องจาก HuggingFace ไม่สามารถเข้าถึงได้ในประเทศจีน คุณสามารถใช้วิธีการต่อไปนี้เพื่อดาวน์โหลดไฟล์โมเดลของ
whisper-large-v3
ดาวน์โหลดที่อยู่:
หลังจากดาวน์โหลดโมเดลแล้ว ให้แตกไฟล์และวางไดเร็กทอรีทั้งหมดลงใน .MoneyPrinterTurbomodels
พาธไฟล์สุดท้ายควรเป็นดังนี้: .MoneyPrinterTurbomodelswhisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
เพลงประกอบที่ใช้สำหรับวิดีโออยู่ในไดเรกทอรี resource/songs
ของโปรเจ็กต์
โปรเจ็กต์ปัจจุบันมีเพลงเริ่มต้นบางส่วนจากวิดีโอ YouTube หากมีการละเมิด โปรดลบออก
ใช้สำหรับแสดงคำบรรยายวิดีโอและอยู่ในไดเร็กทอรี resource/fonts
ของโครงการ คุณยังสามารถใส่แบบอักษรของคุณเองลงไปได้
OpenAI ประกาศว่า ChatGPT 3.5 เปิดให้ใช้งานฟรีแล้ว นักพัฒนาบางรายได้รวมไว้ใน API ที่สามารถเรียกใช้ได้โดยตรง
ตรวจสอบให้แน่ใจว่าคุณได้ติดตั้งและเริ่มบริการนักเทียบท่า แล้ว ดำเนินการคำสั่งต่อไปนี้เพื่อเริ่มบริการนักเทียบท่า
docker run -p 3040:3040 missuo/freegpt35
หลังจากเริ่มต้นสำเร็จ ให้แก้ไขการกำหนดค่าใน config.toml
llm_provider
ถูกตั้งค่าเป็น openai
openai_api_key
ใด ๆ เช่น '123456'openai_base_url
เปลี่ยน http://localhost:3040/v1/
openai_model_name
เปลี่ยนเป็น gpt-3.5-turbo
หมายเหตุ: วิธีการนี้มีความเสถียรน้อยกว่า
ปัญหานี้เกิดจากโมเดลขนาดใหญ่ไม่ส่งคืนการตอบสนองที่ถูกต้อง
มีความเป็นไปได้สูงที่จะเกิดจากเครือข่าย การใช้ VPN หรือการตั้งค่า openai_base_url
เนื่องจากพร็อกซีของคุณควรแก้ไขปัญหาได้
ขอแนะนำให้ใช้ Moonshot หรือ DeepSeek เป็นผู้ให้บริการโมเดลขนาดใหญ่ ผู้ให้บริการทั้งสองรายนี้มีการเข้าถึงที่รวดเร็วและมีเสถียรภาพมากขึ้นในจีน
โดยปกติ ffmpeg จะถูกดาวน์โหลดโดยอัตโนมัติและตรวจพบโดยอัตโนมัติ แต่หากมีปัญหากับสภาพแวดล้อมของคุณและไม่สามารถดาวน์โหลดอัตโนมัติได้ คุณอาจพบข้อผิดพลาดต่อไปนี้:
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
ในขณะนี้ คุณสามารถดาวน์โหลด ffmpeg ได้จาก https://www.gyan.dev/ffmpeg/builds/ หลังจากคลายการบีบอัดแล้ว ให้ตั้งค่า ffmpeg_path
เป็นพาธการติดตั้งจริงของคุณ
[ app ]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \
ffmpeg_path = " C: \ Users \ harry \ Downloads \ ffmpeg.exe "
นโยบายเหล่านี้มีอยู่ในไฟล์การกำหนดค่าของ ImageMagick Policy.xml ไฟล์นี้มักจะอยู่ใน /etc/ImageMagick- X
/ หรือตำแหน่งที่คล้ายกันในไดเร็กทอรีการติดตั้ง ImageMagick แก้ไขรายการที่มี pattern="@"
และเปลี่ยน rights="none"
เป็น rights="read|write"
เพื่ออนุญาตให้อ่านและเขียนไฟล์ได้
ปัญหานี้เกิดจากการจำกัดจำนวนไฟล์ที่เปิดอยู่ของระบบ และสามารถแก้ไขได้โดยการแก้ไขขีดจำกัดของระบบเกี่ยวกับจำนวนไฟล์ที่เปิด
ดูขีดจำกัดปัจจุบัน
ulimit -n
หากต่ำเกินไป คุณสามารถปรับให้สูงขึ้นได้ เป็นต้น
ulimit -n 10240
LocalEntryNotfoundEror: ไม่พบโฟลเดอร์สแน็ปช็อตแคชที่เหมาะสมสำหรับการแก้ไขที่ระบุบนดิสก์ในเครื่องและการรับส่งข้อมูลขาออกถูกปิดใช้งาน หากต้องการเปิดใช้งานการค้นหา repo และดาวน์โหลดออนไลน์ ให้ส่ง 'ไฟล์ในเครื่องเท่านั้น=False' เป็นอินพุต
หรือ
เกิดข้อผิดพลาดขณะซิงโครไนซ์โมเดล Systran/faster-whisper-large-v3 จาก Hugging Face Hub: มีข้อผิดพลาดเกิดขึ้นขณะพยายามค้นหาไฟล์บน Hub และเราไม่พบโฟลเดอร์สแน็ปช็อตที่เหมาะสมสำหรับการแก้ไขที่ระบุบนดิสก์ภายในเครื่อง โปรดตรวจสอบการเชื่อมต่ออินเทอร์เน็ตของคุณแล้วลองอีกครั้ง กำลังพยายามโหลดโมเดลโดยตรงจากแคชในเครื่อง หากมี
วิธีแก้ไข: คลิกเพื่อดูวิธีการดาวน์โหลดโมเดลจากดิสก์เครือข่ายด้วยตนเอง
โปรเจ็กต์นี้ได้รับการปรับโครงสร้างใหม่โดยใช้ https://github.com/FujiwaraChoki/MoneyPrinter ซึ่งได้ทำการปรับปรุงหลายอย่างและเพิ่มฟังก์ชันต่างๆ มากขึ้น ขอขอบคุณผู้เขียนต้นฉบับสำหรับจิตวิญญาณโอเพ่นซอร์สของเขา
คลิกเพื่อดูไฟล์ LICENSE