이 프로젝트의 배포 및 사용 으로 인해 일부 초보 사용자에게는 여전히 특정 임계값이 있습니다 . 이 프로젝트를 기반으로 무료 AI视频生成器
서비스를 제공한 Luka(AI 지능형 멀티미디어 서비스 플랫폼) 웹사이트에 특별한 감사를 표하고 싶습니다. 배포가 필요하지 않으며 온라인으로 사용하면 매우 편리합니다.
프로젝트가 지속적으로 업데이트되고 유지 관리될 수 있도록 이 프로젝트를 지원하고 후원한 Zuotang https://picwish.cn에게 감사드립니다.
Zuotang은 이미지 처리 분야 에 중점을 두고 복잡한 작업을 극도로 단순화하고 이미지 처리를 더욱 단순하게 만드는 풍부한 이미지 처리 도구를 제공합니다.
API
및 Web界面
지원 1080x1920
1920x1080
字体
,位置
,颜色
,大小
조정할 수 있으며字幕描边
설정을 지원합니다. 背景音乐音量
설정 가능 더욱 사실적인 합성 사운드 | ||
---|---|---|
데모-초상화-1.mp4 | 기본값.mp4 | 데모-초상화-2.mp4 |
데모-풍경.mp4 | 데모-풍경-2.mp4 |
원클릭 시작 패키지를 다운로드하고 압축을 푼 후 직접 사용하세요. (경로에는 한자 , 특수문자 , 공백이 포함되어서는 안 됩니다.)
다운로드 후 update.bat
두 번 클릭하여 최신 코드 로 업데이트한 다음 start.bat
두 번 클릭하여 시작하는 것이 좋습니다.
시작 후 브라우저가 자동으로 열립니다(빈 페이지로 열리면 Chrome 또는 Edge 에서 여는 것이 좋습니다).
원클릭 시작 패키지가 아직 생성되지 않았습니다. 아래의 설치 및 배포 섹션을 참조하세요. 더 편리한 docker 배포를 사용하는 것이 좋습니다.
全局流量
모드를 켜야 하는지 확인하세요. git clone https://github.com/harry0703/MoneyPrinterTurbo.git
config.example.toml
파일을 복사하고 이름을 config.toml
로 지정합니다.config.toml
파일의 지침에 따라 pexels_api_keys
및 llm_provider
구성하고 llm_provider에 해당하는 서비스 공급자에 따라 관련 API 키를 구성합니다.Docker가 설치되어 있지 않은 경우 먼저 https://www.docker.com/products/docker-desktop/을 설치해 주세요.
Windows 시스템인 경우 Microsoft 설명서를 참조하십시오.
cd MoneyPrinterTurbo
docker-compose up
브라우저를 열고 http://0.0.0.0:8501을 방문하세요.
브라우저를 열고 http://0.0.0.0:8080/docs 또는 http://0.0.0.0:8080/redoc를 방문하세요.
비디오 튜토리얼
Python 가상 환경을 생성하려면 conda를 사용하는 것이 좋습니다.
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
윈도우:
配置文件config.toml
의 imagemagick_path
실제 설치 경로 로 수정하세요.맥OS:
brew install imagemagick
우분투
sudo apt-get install imagemagick
CentOS
sudo yum install ImageMagick
MoneyPrinterTurbo 프로젝트의根目录
에서 다음 명령을 실행해야 합니다.
conda activate MoneyPrinterTurbo
webui.bat
conda activate MoneyPrinterTurbo
sh webui.sh
시작 후 브라우저가 자동으로 열립니다(빈 페이지로 열리면 Chrome 또는 Edge 에서 여는 것이 좋습니다).
python main.py
시작 후 빠른 경험을 위해 API文档
http://127.0.0.1:8080/docs 또는 http://127.0.0.1:8080/redoc를 보고 온라인으로 인터페이스를 직접 디버깅할 수 있습니다.
지원되는 모든 사운드 목록을 보려면 다음을 참조하세요. 사운드 목록
2024-04-16 v1.1.2에는 API KEY로 구성해야 하는 9개의 새로운 Azure 음성 합성 사운드가 추가되었습니다. 합성된 사운드는 더욱 사실적입니다.
현재 2가지 자막 생성 방법이 지원됩니다.
速度快
생성, 더 나은 성능, 컴퓨터 구성 요구 사항은 없지만 품질이 불안정할 수 있음速度慢
성능이 좋지 않으며 특정 컴퓨터 구성이 필요하지만质量更可靠
. config.toml
구성 파일에서 subtitle_provider
수정하여 전환할 수 있습니다.
생성된 자막의 품질 whisper
edge
로 전환하세요.
알아채다:
HuggingFace는 중국에서는 접속이 불가능하므로 다음 방법을 이용하여
whisper-large-v3
모델 파일을 다운로드 받을 수 있습니다.
다운로드 주소:
모델을 다운로드한 후 압축을 풀고 전체 디렉터리를 .MoneyPrinterTurbomodels
에 배치하세요. 최종 파일 경로는 다음과 같아야 합니다: .MoneyPrinterTurbomodelswhisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
비디오에 사용되는 배경 음악은 프로젝트의 resource/songs
디렉토리에 있습니다.
현재 프로젝트에는 YouTube 동영상의 일부 기본 음악이 포함되어 있습니다. 침해가 있는 경우 삭제하시기 바랍니다.
이는 비디오 자막을 렌더링하는 데 사용되며 프로젝트의 resource/fonts
디렉토리에 있습니다. 자신만의 글꼴을 넣을 수도 있습니다.
OpenAI는 ChatGPT 3.5가 이제 무료라고 발표했습니다. 일부 개발자는 이를 직접 호출할 수 있는 API로 캡슐화했습니다.
docker 서비스를 설치하고 시작했는지 확인하고 다음 명령을 실행하여 docker 서비스를 시작하십시오.
docker run -p 3040:3040 missuo/freegpt35
성공적으로 시작한 후 config.toml
에서 구성을 수정합니다.
llm_provider
openai
로 설정되었습니다.openai_api_key
입력하세요.openai_base_url
http://localhost:3040/v1/
변경되었습니다.openai_model_name
gpt-3.5-turbo
로 변경되었습니다.참고: 이 방법은 덜 안정적입니다.
이 문제는 대형 모델이 올바른 응답을 반환하지 않기 때문에 발생합니다.
VPN을 사용하거나 openai_base_url
프록시로 설정하면 문제가 해결될 가능성이 높습니다.
또한 대형 모델 제공업체로는 Moonshot 이나 DeepSeek를 이용하는 것이 좋습니다. 이 두 서비스 제공업체는 중국에서 더 빠르고 안정적인 액세스를 제공합니다.
일반적으로 ffmpeg는 자동으로 다운로드되어 자동으로 감지됩니다. 하지만 환경에 문제가 있어 자동 다운로드가 불가능할 경우 다음과 같은 오류가 발생할 수 있습니다.
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
이때, https://www.gyan.dev/ffmpeg/builds/에서 ffmpeg를 다운로드 받을 수 있습니다. 압축을 푼 후 ffmpeg_path
실제 설치 경로로 설정하세요.
[ app ]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \
ffmpeg_path = " C: \ Users \ harry \ Downloads \ ffmpeg.exe "
이러한 정책은 ImageMagick의 구성 파일policy.xml에서 찾을 수 있습니다. 이 파일은 일반적으로 /etc/ImageMagick- X
/ 또는 ImageMagick 설치 디렉터리의 유사한 위치에 있습니다. 파일 읽기 및 쓰기를 허용하려면 pattern="@"
이 포함된 항목을 수정하고 rights="none"
을 rights="read|write"
로 변경합니다.
이 문제는 시스템의 열린 파일 수 제한으로 인해 발생하며 시스템의 열린 파일 수 제한을 수정하여 해결할 수 있습니다.
현재 한도 보기
ulimit -n
예를 들어 너무 낮으면 더 높게 조정할 수 있습니다.
ulimit -n 10240
LocalEntryNotfoundEror: 로컬 디스크에서 지정된 개정에 대해 캐시된 적절한 스냅샷 폴더를 찾을 수 없으며 나가는 트래픽이 비활성화되었습니다. repo 조회 및 온라인 다운로드를 활성화하려면 'local files only=False'를 입력으로 전달하십시오.
또는
Hugging Face Hub에서 Systran/faster-whisper-large-v3 모델을 동기화하는 동안 오류가 발생했습니다. Hub에서 파일을 찾는 동안 오류가 발생했으며 로컬 디스크에서 지정된 개정에 대한 적절한 스냅샷 폴더를 찾을 수 없습니다. . 인터넷 연결을 확인하고 로컬 캐시가 있는 경우 모델을 직접 로드해 보세요.
해결 방법: 네트워크 디스크에서 모델을 수동으로 다운로드하는 방법을 보려면 클릭하세요.
이 프로젝트는 https://github.com/FujiwaraChoki/MoneyPrinter를 기반으로 리팩터링되었으며 많은 최적화가 이루어졌고 더 많은 기능이 추가되었습니다. 오픈 소스 정신을 발휘한 원저자에게 감사드립니다.
LICENSE
파일을 보려면 클릭하세요.