Devido à implantação e uso deste projeto, ainda há um certo limite para alguns usuários novatos. Gostaria de expressar meus agradecimentos especiais ao site Luka (AI Intelligent Multimedia Service Platform) por fornecer serviços gratuitos AI视频生成器
baseados neste projeto. Não é necessária implantação, basta usá-lo online, o que é muito conveniente.
Obrigado a Zuotang https://picwish.cn por apoiar e patrocinar este projeto, o que permite que o projeto seja continuamente atualizado e mantido.
Zuotang se concentra no campo de processamento de imagens e fornece uma variedade de ferramentas de processamento de imagens para simplificar extremamente operações complexas e realmente tornar o processamento de imagens mais simples.
API
e Web界面
1080x1920
1920x1080
字体
,位置
,颜色
,大小
e suporta configurações字幕描边
. 背景音乐音量
pode ser definido Sons sintetizados mais realistas | ||
---|---|---|
demo-retrato-1.mp4 | padrão.mp4 | demo-retrato-2.mp4 |
demo-paisagem.mp4 | demo-paisagem-2.mp4 |
Baixe o pacote de inicialização com um clique, descompacte-o e use-o diretamente (o caminho não deve conter caracteres chineses , caracteres especiais ou espaços )
Após o download, é recomendável clicar duas vezes em update.bat
para atualizar para o código mais recente e, em seguida, clicar duas vezes em start.bat
para iniciar.
Após a inicialização, o navegador abrirá automaticamente (se abrir em branco, é recomendado abri-lo no Chrome ou Edge )
O pacote de inicialização com um clique ainda não foi criado. Consulte a seção de instalação e implantação abaixo. Recomenda-se usar a implantação do docker , que é mais conveniente.
全局流量
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
config.example.toml
e nomeie-o config.toml
config.toml
para configurar pexels_api_keys
e llm_provider
e configure a chave de API relevante de acordo com o provedor de serviços correspondente a llm_provider.Se o Docker não estiver instalado, instale-o primeiro https://www.docker.com/products/docker-desktop/
Se for um sistema Windows, consulte a documentação da Microsoft:
cd MoneyPrinterTurbo
docker-compose up
Abra o navegador e visite http://0.0.0.0:8501
Abra o navegador e visite http://0.0.0.0:8080/docs ou http://0.0.0.0:8080/redoc
Tutorial em vídeo
Recomenda-se usar conda para criar um ambiente virtual python
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
Windows:
imagemagick_path
no配置文件config.toml
para o seu caminho de instalação realMacOS:
brew install imagemagick
Ubuntu
sudo apt-get install imagemagick
CentOS
sudo yum install ImageMagick
Observe que você precisa executar o seguinte comando no根目录
do projeto MoneyPrinterTurbo
conda activate MoneyPrinterTurbo
webui.bat
conda activate MoneyPrinterTurbo
sh webui.sh
Após a inicialização, o navegador abrirá automaticamente (se abrir em branco, é recomendado abri-lo no Chrome ou Edge )
python main.py
Após a inicialização, você pode visualizar API文档
http://127.0.0.1:8080/docs ou http://127.0.0.1:8080/redoc para depurar diretamente a interface online para uma experiência rápida.
Para obter uma lista de todos os sons suportados, você pode visualizar: Lista de Sons
2024-04-16 v1.1.2 adiciona 9 novos sons de síntese de fala do Azure, que precisam ser configurados com API KEY. Os sons sintetizados são mais realistas.
Atualmente, são suportados 2 métodos de geração de legendas:
速度快
, melhor desempenho, sem requisitos de configuração do computador, mas a qualidade pode ser instável速度慢
, o desempenho é ruim e requer certas configurações do computador, mas质量更可靠
. Você pode modificar subtitle_provider
no arquivo de configuração config.toml
para alternar
Recomenda-se usar o modo edge
. Se a qualidade das legendas geradas não for boa, mude para o modo whisper
.
Perceber:
Como o HuggingFace não está acessível na China, você pode usar o seguinte método para baixar o arquivo do modelo do
whisper-large-v3
Endereço para baixar:
Após baixar o modelo, descompacte-o e coloque todo o diretório em .MoneyPrinterTurbomodels
. O caminho final do arquivo deve ser assim: .MoneyPrinterTurbomodelswhisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
A música de fundo usada para vídeos está localizada no diretório resource/songs
do projeto.
O projeto atual contém algumas músicas padrão de vídeos do YouTube. Se houver alguma violação, exclua-as.
Ele é usado para renderizar legendas de vídeo e está localizado no diretório de resource/fonts
do projeto. Você também pode colocar suas próprias fontes nele.
OpenAI anunciou que ChatGPT 3.5 agora é gratuito. Alguns desenvolvedores o encapsularam em uma API que pode ser chamada diretamente.
Certifique-se de ter instalado e iniciado o serviço docker , execute o seguinte comando para iniciar o serviço docker
docker run -p 3040:3040 missuo/freegpt35
Após a inicialização bem-sucedida, modifique a configuração em config.toml
llm_provider
está definido como openai
openai_api_key
, como '123456'openai_base_url
alterado http://localhost:3040/v1/
openai_model_name
alterado para gpt-3.5-turbo
Nota: Este método é menos estável
Esse problema é causado por modelos grandes que não retornam respostas corretas.
Há uma grande probabilidade de que seja causado pela rede. Usar uma VPN ou definir openai_base_url
como seu proxy deve resolver o problema.
Também é recomendado usar Moonshot ou DeepSeek como um grande provedor de modelos. Esses dois provedores de serviços têm acesso mais rápido e estável na China.
Normalmente, o ffmpeg é baixado e detectado automaticamente. Mas se houver um problema com o seu ambiente e o download automático não puder ocorrer, você poderá encontrar o seguinte erro:
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
Neste momento, você pode baixar o ffmpeg em https://www.gyan.dev/ffmpeg/builds/. Após descompactar, defina ffmpeg_path
para o caminho de instalação real.
[ app ]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \
ffmpeg_path = " C: \ Users \ harry \ Downloads \ ffmpeg.exe "
Essas políticas podem ser encontradas no arquivo de configuração do ImageMagick, policy.xml. Este arquivo geralmente está localizado em /etc/ImageMagick- X
/ ou em um local semelhante no diretório de instalação do ImageMagick. Modifique a entrada que contém pattern="@"
e altere rights="none"
para rights="read|write"
para permitir a leitura e gravação do arquivo.
Esse problema é causado pelo limite do sistema no número de arquivos abertos e pode ser resolvido modificando o limite do sistema no número de arquivos abertos.
Ver limites atuais
ulimit -n
Se estiver muito baixo, você pode ajustá-lo para mais alto, por exemplo
ulimit -n 10240
LocalEntryNotfoundEror: Não é possível encontrar uma pasta de instantâneos em cache apropriada para a revisão especificada no disco local e o tráfego de saída foi desativado. Para ativar pesquisas e downloads de repositórios on-line, passe 'somente arquivos locais = Falso' como entrada.
ou
Ocorreu um erro ao sincronizar o modelo Systran/faster-whisper-large-v3 do Hugging Face Hub: Ocorreu um erro ao tentar localizar os arquivos no Hub e não conseguimos encontrar a pasta de instantâneo apropriada para a revisão especificada no disco local . Verifique sua conexão com a Internet e tente novamente. Tentando carregar o modelo diretamente do cache local, se existir.
Solução: Clique para ver como baixar manualmente o modelo do disco de rede
Este projeto foi refatorado com base em https://github.com/FujiwaraChoki/MoneyPrinter. Ele fez muitas otimizações e adicionou mais funções. Obrigado ao autor original por seu espírito de código aberto.
Clique para visualizar o arquivo LICENSE