このプロジェクトの導入と使用には、一部の初心者ユーザーにとってまだ一定の敷居が存在します。このプロジェクトに基づいて無料のAI视频生成器
サービスを提供してくださったLuka (AI インテリジェント マルチメディア サービス プラットフォーム) の Web サイトに特別な感謝を表したいと思います。 . 展開は必要なく、オンラインで使用するだけで非常に便利です。
このプロジェクトをサポートおよび後援してくださった Zuotang https://picwish.cn に感謝します。これにより、プロジェクトの継続的な更新と維持が可能になります。
Zuotang は画像処理の分野に焦点を当てており、複雑な操作を非常に簡素化し、画像処理を真に簡素化する豊富な画像処理ツールを提供しています。
API
とWeb界面
をサポート1080x1920
1920x1080
字体
、位置
、颜色
、大小
を調整でき、字幕描边
設定をサポートします。 背景音乐音量
設定可能よりリアルな合成音 | ||
---|---|---|
デモポートレート-1.mp4 | デフォルト.mp4 | デモポートレート-2.mp4 |
デモ風景.mp4 | デモ-風景-2.mp4 |
ワンクリック スタートアップ パッケージをダウンロードし、解凍して直接使用します (パスには漢字、特殊文字、またはスペースを含めることはできません)。
ダウンロード後、 update.bat
ダブルクリックして最新のコードに更新し、 start.bat
をダブルクリックして開始することをお勧めします。
起動後、ブラウザが自動的に開きます(空白で開く場合は、 ChromeまたはEdgeで開くことをお勧めします)
ワンクリック スタートアップ パッケージはまだ作成されていません。以下のインストールとデプロイメントのセクションを参照してください。より便利なdockerデプロイメントを使用することをお勧めします。
全局流量
モードをオンにする必要があることを確認してください。 git clone https://github.com/harry0703/MoneyPrinterTurbo.git
config.example.toml
ファイルをコピーし、 config.toml
という名前を付けます。config.toml
ファイルの指示に従ってpexels_api_keys
とllm_provider
を構成し、 llm_provider に対応するサービス プロバイダーに従って関連する API キーを構成します。Docker がインストールされていない場合は、最初にインストールしてください https://www.docker.com/products/docker-desktop/
Windows システムの場合は、Microsoft のドキュメントを参照してください。
cd MoneyPrinterTurbo
docker-compose up
ブラウザを開いて http://0.0.0.0:8501 にアクセスします。
ブラウザを開いて http://0.0.0.0:8080/docs または http://0.0.0.0:8080/redoc にアクセスします。
ビデオチュートリアル
Python 仮想環境を作成するには conda を使用することをお勧めします
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt
Windows:
配置文件config.toml
内のimagemagick_path
実際のインストール パスに変更します。MacOS:
brew install imagemagick
Ubuntu
sudo apt-get install imagemagick
CentOS
sudo yum install ImageMagick
MoneyPrinterTurbo プロジェクトの根目录
で次のコマンドを実行する必要があることに注意してください。
conda activate MoneyPrinterTurbo
webui.bat
conda activate MoneyPrinterTurbo
sh webui.sh
起動後、ブラウザが自動的に開きます(空白で開く場合は、 ChromeまたはEdgeで開くことをお勧めします)
python main.py
起動後、 API文档
http://127.0.0.1:8080/docs または http://127.0.0.1:8080/redoc を参照して、インターフェイスをオンラインで直接デバッグして、簡単に体験できます。
サポートされているすべてのサウンドのリストについては、以下を参照してください: サウンド リスト
2024-04-16 v1.1.2 では、API KEY を使用して設定する必要がある 9 つの新しい Azure 音声合成サウンドが追加されます。合成されたサウンドはよりリアルになります。
現在、2 つの字幕生成方法がサポートされています。
速度快
、パフォーマンスが高く、コンピューターの構成要件はありませんが、品質が不安定になる可能性があります速度慢
、パフォーマンスも悪く、特定のコンピュータ設定が必要ですが、质量更可靠
。 config.toml
設定ファイル内のsubtitle_provider
変更して切り替えることができます。
生成された字幕の品質whisper
良くない場合は、 edge
モードを使用することをお勧めします。
知らせ:
中国ではHuggingFaceにアクセスできないため、次の方法で
whisper-large-v3
のモデルファイルをダウンロードできます。
ダウンロードアドレス:
モデルをダウンロードした後、それを解凍し、ディレクトリ全体を.MoneyPrinterTurbomodels
に配置します。最終的なファイル パスは次のようになります: .MoneyPrinterTurbomodelswhisper-large-v3
MoneyPrinterTurbo
├─models
│ └─whisper-large-v3
│ config.json
│ model.bin
│ preprocessor_config.json
│ tokenizer.json
│ vocabulary.json
ビデオに使用される BGM は、プロジェクトのresource/songs
ディレクトリにあります。
現在のプロジェクトには YouTube 動画のデフォルトの音楽が含まれています。侵害がある場合は削除してください。
これはビデオ字幕のレンダリングに使用され、プロジェクトのresource/fonts
ディレクトリにあります。独自のフォントをそこに置くこともできます。
OpenAI は、ChatGPT 3.5 が無料になったことを発表しました。一部の開発者は、ChatGPT 3.5 を直接呼び出し可能な API にカプセル化しました。
docker サービスをインストールして開始していることを確認し、次のコマンドを実行して docker サービスを開始します。
docker run -p 3040:3040 missuo/freegpt35
正常に起動したら、 config.toml
の構成を変更します。
llm_provider
openai
に設定されていますopenai_api_key
を入力するだけですopenai_base_url
http://localhost:3040/v1/
変更されましたopenai_model_name
がgpt-3.5-turbo
に変更されました注: この方法は安定性が低くなります
この問題は、大規模なモデルが正しい応答を返さないことが原因で発生します。
ネットワークが原因である可能性が高く、 VPN を使用するか、プロキシとしてopenai_base_url
を設定すると、問題が解決されるはずです。
中国では、大規模なモデル プロバイダーとして、 MoonshotまたはDeepSeek を使用することも推奨されます。これら 2 つのサービス プロバイダーは、より高速で安定したアクセスを提供します。
通常、ffmpeg は自動的にダウンロードされ、自動的に検出されます。 ただし、環境に問題があり自動ダウンロードができない場合は、次のエラーが発生することがあります。
RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.
現時点では、https://www.gyan.dev/ffmpeg/builds/ から ffmpeg をダウンロードできます。解凍後、 ffmpeg_path
実際のインストール パスに設定します。
[ app ]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \
ffmpeg_path = " C: \ Users \ harry \ Downloads \ ffmpeg.exe "
これらのポリシーは、ImageMagick の設定ファイル、policy.xml にあります。 このファイルは通常、/etc/ImageMagick- X
/、または ImageMagick インストール ディレクトリ内の同様の場所にあります。 pattern="@"
を含むエントリを変更し、 rights="none"
をrights="read|write"
に変更して、ファイルの読み取りと書き込みを許可します。
この問題は、開いているファイルの数に対するシステムの制限によって発生します。開いているファイルの数に対するシステムの制限を変更することで解決できます。
現在の制限を表示する
ulimit -n
低すぎる場合は、より高く調整できます。
ulimit -n 10240
LocalEntryNotfoundEror: ローカル ディスク上で指定されたリビジョンに適切なキャッシュされたスナップショット フォルダーが見つかりません。オンラインでのリポジトリ検索とダウンロードを有効にするには、入力として「local filesonly=False」を渡します。
または
Hugging Face ハブからモデル Systran/faster-whisper-large-v3 を同期中にエラーが発生しました: ハブ上のファイルを見つけようとしたときにエラーが発生しました。指定されたリビジョンの適切なスナップショット フォルダーがローカル ディスク上に見つかりませんインターネット接続を確認し、ローカル キャッシュが存在する場合は、そこから直接モデルをロードしてみてください。
解決策: クリックすると、ネットワーク ディスクからモデルを手動でダウンロードする方法が表示されます。
このプロジェクトは https://github.com/FujiwaraChoki/MoneyPrinter をベースにリファクタリングされ、多くの最適化と機能の追加が行われています。 オリジナルの作者のオープンソース精神に感謝します。
クリックしてLICENSE
ファイルを表示します