ある言語の動画を指定した言語の動画に翻訳し、その言語の字幕や吹き替えを自動生成・追加できる動画翻訳・吹き替えツールです。 API 呼び出しをサポートします
音声認識は、 faster-whisper
およびopenai-whisper
のローカル オフライン モデルとOpenAI SpeechToText API
GoogleSpeech
阿里中文语音识别模型
とビーン バッグ モデルをサポートし、カスタム音声認識 API をサポートします。
テキスト翻訳は微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT
をサポートします。
テキスト合成音声は、 Microsoft Edge tts
Google tts
Azure AI TTS
Openai TTS
Elevenlabs TTS
自定义TTS服务器api
GPT-SoVITS
クローン音声 ChatTTS-ui Fish TTS CosyVoice をサポートします
バックグラウンド伴奏音楽などを保持できるようにします(uvr5 ベース)
対応言語:中国語(簡体字・繁体字)、英語、韓国語、日本語、ロシア語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語、ベトナム語、タイ語、アラビア語、トルコ語、ハンガリー語、インド語、ウクライナ語、カザフ語、インドネシア語、マレー語、チェコ語、ポーランド語、オランダ語、スウェーデン語/その他の言語オプションの自動検出
[スポンサー]
302.AIは、世界のトップブランドを集めた従量課金制、月額料金ゼロ、各種AIの利用敷居ゼロのAIスーパーマーケットです。
充実した機能 / 使いやすさ / オンデマンド支払いの敷居ゼロ / 管理者とユーザーの分離
【ビデオと吹き替えを自動翻訳】ビデオ内の音声を別の言語の吹き替えに翻訳し、その言語の字幕を埋め込みます。
【音声認識・音声・動画を字幕に変換】音声・動画ファイル内の人の声をテキストとして一括認識し、srt字幕ファイルとしてエクスポート可能
[音声合成/字幕吹き替え] ローカルの既存の srt 字幕ファイルに基づいて吹き替えを作成し、単一またはバッチ字幕をサポートします
[字幕ファイルの翻訳] 1 つ以上の srt 字幕ファイルを他の言語の字幕ファイルに翻訳します。
【動画と音声を結合】動画ファイルと音声ファイルを1対1対応で一括結合します。
[ビデオとsrt字幕を結合]ビデオファイルとsrt字幕ファイルを1つずつバッチ結合します。
【動画に画像ウォーターマークを追加】動画ファイルに画像ウォーターマークを一括で埋め込みます。
【動画から音声を抽出】動画を音声ファイルと無音動画に分離
【音声・動画フォーマット変換】音声・動画フォーマットを一括変換
【字幕の編集と複数の形式へのエクスポート】srt、vtt、および ass 形式の字幕のインポートをサポートし、編集後、フォント スタイル、色などを設定して、対応する形式で字幕をエクスポートできます。
【字幕形式変換】字幕ファイルをsrt/ass/vtt形式に一括変換
【YouTube動画ダウンロード】 YouTubeから動画をダウンロードできます。
【ボーカルBGMの分離】
[API呼び出し]音声合成、言語認識、字幕翻訳、ビデオ翻訳インターフェース呼び出しをサポート
ウイルス対策ソフトウェアと署名なしでパッケージ化するには、pyinstaller を使用します。ウイルス対策ソフトウェアを信頼リストに追加するか、展開用のソース コードを使用してください。
[クリックしてパッケージ化されたバージョンをダウンロードし、スペースを含まない英語のディレクトリに解凍して、sp.exe (https://github.com/jianchang512/pyvideotrans/releases) をダブルクリックします。
英語のパスに解凍します。パスにはスペースが含まれません。解凍後、sp.exe をダブルクリックします (権限の問題が発生した場合は、右クリックして管理者権限で開くことができます)
注: 使用前に解凍する必要があります。圧縮パッケージ内で直接ダブルクリックしたり、解凍後に sp.exe ファイルを他の場所に移動したりすることはできません。
ターミナル ウィンドウを開き、次のコマンドをそれぞれ実行します。
実行する前に Homebrew がインストールされていることを確認してください。Homebrew がインストールされていない場合は、最初にインストールする必要があります。
コマンドを実行して Homebrew をインストールします:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
インストールが完了したら、
eval $(brew --config)
を実行します。
brew install libsndfile brew install ffmpeg brew install git brew install [email protected]
実行を継続する
export PATH="/usr/local/opt/[email protected]/bin:$PATH" source ~/.bash_profile source ~/.zshrc
スペースや漢字を含まないフォルダーを作成し、そのフォルダーをターミナルに入力します。
ターミナルでコマンドgit clone https://github.com/jianchang512/pyvideotrans
を実行します。
コマンドcd pyvideotrans
を実行します。
python -m venv venv
を実行し続けます。
コマンドsource ./venv/bin/activate
の実行を続けます。実行後、ターミナルのコマンド プロンプトが(venv)
で始まるように変更されていることを確認します。次のコマンドは、ターミナル プロンプトが(venv)
で始まることを確認する必要があります。
pip install -r requirements.txt
を実行します。プロンプトが失敗した場合は、次の 2 つのコマンドを実行して、pip イメージを Alibaba イメージに切り替えます。
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
Alibaba イメージ ソースに切り替えても失敗する場合は、 pip install -r requirements.txt
実行してください。
python sp.py
ソフトウェアインターフェイスを開きます
CentOS/RHEL システムでは、python3.10 をインストールするために次のコマンドを実行します。
sudo yum update sudo yum groupinstall "Development Tools" sudo yum install openssl-devel bzip2-devel libffi-devel cd /tmp wget https://www.python.org/ftp/python/3.10.4/Python-3.10.4.tgz tar xzf Python-3.10.4.tgz cd Python-3.10.4 ./configure — enable-optimizations sudo make && sudo make install sudo alternatives — install /usr/bin/python3 python3 /usr/local/bin/python3.10 1 sudo yum install -y ffmpeg
Ubuntu/Debian システムの場合、次のコマンドを実行して python3.10 をインストールします。
apt update && apt upgrade -y apt install software-properties-common -y add-apt-repository ppa:deadsnakes/ppa apt update sudo apt-get install libxcb-cursor0 apt install python3.10 curl -sS https://bootstrap.pypa.io/get-pip.py | python3.10 sudo update-alternatives --install /usr/bin/python python /usr/local/bin/python3.10 1 sudo update-alternatives --config python apt-get install ffmpeg
任意のターミナルを開いてpython3 -V
を実行すると、「3.10.4」が表示されればインストール成功、それ以外の場合は失敗します。
スペースや漢字を含まないフォルダーを作成し、ターミナルからフォルダーを開きます。
ターミナルでコマンドgit clone https://github.com/jianchang512/pyvideotrans
を実行します。
コマンドcd pyvideotrans
の実行を続けます。
python -m venv venv
を実行し続けます。
コマンドsource ./venv/bin/activate
の実行を続けます。実行後、ターミナルのコマンド プロンプトが(venv)
で始まるように変更されていることを確認します。次のコマンドは、ターミナル プロンプトが(venv)
で始まることを確認する必要があります。
pip install -r requirements.txt
を実行します。プロンプトが失敗した場合は、次の 2 つのコマンドを実行して、pip イメージを Alibaba イメージに切り替えます。
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
Alibaba イメージ ソースに切り替えても失敗する場合は、 pip install -r requirements.txt
を再実行してください。
CUDAアクセラレーションを使用したい場合は別途実行してください
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
pip install nvidia-cublas-cu11 nvidia-cudnn-cu11
linux cuda アクセラレーションを有効にしたい場合は、NVIDIA グラフィックス カードが必要で、CUDA11.8+ 環境を設定する必要があります。「Linux CUDA インストール」を検索してください。
python sp.py
ソフトウェアインターフェイスを開きます
https://www.python.org/downloads/ を開いて Windows 3.10 をダウンロードし、ダブルクリックして [PATH に追加] を選択してください。
cmd を開き、 python -V
を実行します。出力が3.10.4
でない場合は、インストール エラーがあるか、 Add to PATH
が追加されていないことを意味します。
https://github.com/git-for-windows/git/releases/download/v2.45.0.windows.1/Git-2.45.0-64-bit.exe を開き、git をダウンロードして、次のファイルをダブルクリックします。ダウンロード後のステップ。
スペースや漢字を含まないフォルダーを見つけて、アドレスバーにcmd
と入力して Enter キーを押し、ターミナルを開き、ターミナルで次のコマンドを実行します。
コマンドgit clone https://github.com/jianchang512/pyvideotrans
コマンドcd pyvideotrans
の実行を続けます。
python -m venv venv
を実行し続けます。
コマンド.venvscriptsactivate
の実行を続けます。実行後、コマンド ラインの先頭が(venv)
に変わっているかどうかを確認してください。そうでない場合は、エラーが発生します。
pip install -r requirements.txt
を実行します。プロンプトが失敗した場合は、次の 2 つのコマンドを実行して、pip イメージを Alibaba イメージに切り替えます。
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
Alibaba イメージ ソースに切り替えても失敗する場合は、 pip install -r requirements.txt
を再実行してください。
CUDAアクセラレーションを使用したい場合は別途実行してください
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
Windows CUDA アクセラレーションを有効にする場合は、NVIDIA グラフィックス カードを使用し、CUDA11.8 以降の環境を構成する必要があります。具体的なインストールについては、「CUDA アクセラレーションのサポート」を参照してください。
ffmpeg.zip を現在のソース コード ディレクトリに解凍します。上書きするように求められたら、上書きします。解凍後、ソース コードの下の ffmpeg.exe ffprobe.exe ytwin32.exe が表示されることを確認します。
python sp.py
ソフトウェアインターフェイスを開きます
ctranslate2 の 4.x バージョンがデフォルトで使用され、CUDA12.x バージョンのみをサポートします。cuda が 12 未満であり、cuda を 12.x にアップグレードできない場合は、コマンドを実行して ctranslate2 をアンインストールしてから再インストールしてください。
pip uninstall -y ctranslate2 pip install ctranslate2==3.24.0
xx module not found
」などのエラーが発生する場合があります。requirements.txt を開いて xx モジュールを検索し、しばらくしてから xx の後の == とバージョン番号を削除してください。
Mac でのソース コードの展開/B ステーション
Gemini API/ステーション b を使用してビデオ翻訳を設定する方法
ダウンロードとインストール方法
ChatTTS-ui: ChatTTS を使用してサウンドを合成する UI インターフェイス
OTT: ローカルのオフラインテキスト翻訳ツール
音声クローン作成ツール: 任意の音色で音声を合成
音声認識ツール: ローカルのオフライン音声認識からテキストへのツール
ボーカルBGM分離:ボーカルとBGM分離ツール
GPT-SoVITSのapi.pyの改良版
CosyVoice に適応した api.py
このプログラムが主に依存しているいくつかのオープンソース プロジェクト
ffmpeg
PySide6
エッジ-tts
より早いささやき声
オープンナイ・ウィスパー
パイダブ