Hierbei handelt es sich um ein Videoübersetzungs- und Synchronisationstool, das Videos in einer Sprache in Videos in einer bestimmten Sprache übersetzen und automatisch Untertitel und Synchronisationen in dieser Sprache generieren und hinzufügen kann. und unterstützt API-Aufrufe
Die Spracherkennung unterstützt lokale Offline-Modelle faster-whisper
und openai-whisper
sowie OpenAI SpeechToText API
阿里中文语音识别模型
und das Bean-Bag-Modell GoogleSpeech
Alibaba und unterstützt die benutzerdefinierte Spracherkennungs-API.
Die Textübersetzung unterstützt微软翻译|Google翻译|百度翻译|腾讯翻译|ChatGPT|AzureAI|Gemini|DeepL|DeepLX|字节火山|离线翻译OTT
Textsynthese-Sprache unterstützt Microsoft Edge tts
Google tts
Azure AI TTS
Openai TTS
Elevenlabs TTS
自定义TTS服务器api
GPT-SoVITS
Clone-Voice ChatTTS-UI Fish TTS CosyVoice
Ermöglicht die Beibehaltung von Hintergrundmusik usw. (basierend auf uvr5)
Unterstützte Sprachen: Chinesisch (vereinfacht und traditionell), Englisch, Koreanisch, Japanisch, Russisch, Französisch, Deutsch, Italienisch, Spanisch, Portugiesisch, Vietnamesisch, Thailändisch, Arabisch, Türkisch, Ungarisch, Indisch, Ukrainisch, Kasachisch, Indonesisch, Malaiisch, Tschechisch, Polnisch, Niederländisch, Schwedisch/andere Sprachen optionale automatische Erkennung
[Sponsor]
302.AI ist ein KI-Supermarkt, der die weltweit führenden Marken vereint, mit nutzungsbasierter Bezahlung, null monatlichen Gebühren und null Schwellenwerten für die Nutzung verschiedener Arten von KI.
Umfassende Funktionen/einfache Bedienung/Nullschwelle für Bezahlung auf Abruf/Trennung von Managern und Benutzern
[Video und Synchronisation automatisch übersetzen] Übersetzen Sie den Ton im Video in eine Synchronisation in einer anderen Sprache und betten Sie Untertitel in dieser Sprache ein
[Spracherkennung/Audio und Video in Untertitel konvertieren] Kann menschliche Stimmen in Audio- und Videodateien stapelweise als Text erkennen und als SRT-Untertiteldateien exportieren
[Sprachsynthese/Untertitelsynchronisierung] Erstellen Sie eine Synchronisierung basierend auf lokal vorhandenen SRT-Untertiteldateien und unterstützen Sie Einzel- oder Stapeluntertitel
[Untertiteldateien übersetzen] Übersetzen Sie eine oder mehrere SRT-Untertiteldateien in Untertiteldateien in anderen Sprachen
[Video und Audio zusammenführen] Führen Sie Videodateien und Audiodateien stapelweise in einer Eins-zu-Eins-Korrespondenz zusammen
[Video und SRT-Untertitel zusammenführen] Videodateien und SRT-Untertiteldateien nacheinander stapelweise zusammenführen
[Bildwasserzeichen zu Videos hinzufügen] Betten Sie Bildwasserzeichen stapelweise in Videodateien ein
【Audio aus Video extrahieren】 Video in Audiodateien und stilles Video aufteilen
[Konvertierung von Audio- und Videoformaten] Konvertieren Sie Audio- und Videoformate stapelweise
[Bearbeiten und Exportieren von Untertiteln in mehrere Formate] Unterstützt den Import von Untertiteln in den Formaten srt, vtt und ass. Nach der Bearbeitung können Sie den Schriftstil, die Farbe usw. festlegen, um Untertitel im entsprechenden Format zu exportieren.
[Konvertierung des Untertitelformats] Konvertieren Sie Untertiteldateien stapelweise in die Formate srt/ass/vtt
[YouTube-Videos herunterladen] Videos können von YouTube heruntergeladen werden
[Trennung der stimmlichen Hintergrundmusik]
[API-Aufruf] Unterstützt Schnittstellenaufrufe für Sprachsynthese, Spracherkennung, Untertitelübersetzung und Videoübersetzung
Verwenden Sie Pyinstaller zum Verpacken ohne Antiviren- und Signatursoftware. Bitte fügen Sie es der Vertrauensliste hinzu oder verwenden Sie den Quellcode für die Bereitstellung.
[Klicken Sie, um die vorgefertigte Version herunterzuladen, entpacken Sie sie in ein englisches Verzeichnis ohne Leerzeichen und doppelklicken Sie auf sp.exe (https://github.com/jianchang512/pyvideotrans/releases).
Entpacken Sie es in einen englischen Pfad, der keine Leerzeichen enthält. Doppelklicken Sie nach dem Entpacken auf sp.exe (bei Berechtigungsproblemen können Sie mit der rechten Maustaste klicken und mit Administratorrechten öffnen).
Hinweis: Sie muss vor der Verwendung dekomprimiert werden. Sie kann weder direkt im komprimierten Paket doppelgeklickt werden, noch kann die Datei sp.exe nach der Dekomprimierung an andere Speicherorte verschoben werden.
Öffnen Sie ein Terminalfenster und führen Sie jeweils die folgenden Befehle aus:
Stellen Sie sicher, dass Homebrew installiert ist, bevor Sie es ausführen. Wenn Sie Homebrew nicht installiert haben, müssen Sie es zuerst installieren.
Führen Sie den Befehl aus, um Homebrew zu installieren:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Führen Sie nach Abschluss der Installation Folgendes aus:
eval $(brew --config)
brew install libsndfile brew install ffmpeg brew install git brew install [email protected]
Setzen Sie die Ausführung fort
export PATH="/usr/local/opt/[email protected]/bin:$PATH" source ~/.bash_profile source ~/.zshrc
Erstellen Sie einen Ordner ohne Leerzeichen und chinesische Zeichen und geben Sie den Ordner im Terminal ein.
Führen Sie den Befehl git clone https://github.com/jianchang512/pyvideotrans
im Terminal aus
Führen Sie den Befehl cd pyvideotrans
aus
Fahren Sie mit der Ausführung python -m venv venv
fort
Führen Sie den Befehl source ./venv/bin/activate
weiter aus. Überprüfen und bestätigen Sie nach der Ausführung, dass die Terminal-Eingabeaufforderung mit (venv)
beginnt. Die folgenden Befehle müssen sicherstellen, dass die Terminal-Eingabeaufforderung mit (venv)
beginnt.
Führen Sie pip install -r requirements.txt
aus. Wenn die Eingabeaufforderung fehlschlägt, führen Sie die folgenden zwei Befehle aus, um das Pip-Image auf das Alibaba-Image umzustellen.
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
Führen Sie es dann erneut aus. Wenn Sie zur Alibaba-Image-Quelle gewechselt haben und es immer noch fehlschlägt, versuchen Sie bitte pip install -r requirements.txt
auszuführen
python sp.py
öffnet die Softwareschnittstelle
Das CentOS/RHEL-System führt die folgenden Befehle aus, um Python3.10 zu installieren
sudo yum update sudo yum groupinstall "Development Tools" sudo yum install openssl-devel bzip2-devel libffi-devel cd /tmp wget https://www.python.org/ftp/python/3.10.4/Python-3.10.4.tgz tar xzf Python-3.10.4.tgz cd Python-3.10.4 ./configure — enable-optimizations sudo make && sudo make install sudo alternatives — install /usr/bin/python3 python3 /usr/local/bin/python3.10 1 sudo yum install -y ffmpeg
Führen Sie für ein Ubuntu/Debian-System den folgenden Befehl aus, um Python3.10 zu installieren
apt update && apt upgrade -y apt install software-properties-common -y add-apt-repository ppa:deadsnakes/ppa apt update sudo apt-get install libxcb-cursor0 apt install python3.10 curl -sS https://bootstrap.pypa.io/get-pip.py | python3.10 sudo update-alternatives --install /usr/bin/python python /usr/local/bin/python3.10 1 sudo update-alternatives --config python apt-get install ffmpeg
Öffnen Sie ein beliebiges Terminal und führen Sie python3 -V
aus. Wenn „3.10.4“ angezeigt wird, ist die Installation erfolgreich, andernfalls schlägt sie fehl.
Erstellen Sie einen Ordner ohne Leerzeichen und chinesische Zeichen und öffnen Sie den Ordner über das Terminal.
Führen Sie den Befehl git clone https://github.com/jianchang512/pyvideotrans
im Terminal aus
Führen Sie den Befehl cd pyvideotrans
weiter aus
Fahren Sie mit der Ausführung python -m venv venv
fort
Führen Sie den Befehl source ./venv/bin/activate
weiter aus. Überprüfen und bestätigen Sie nach der Ausführung, dass die Terminal-Eingabeaufforderung mit (venv)
beginnt. Die folgenden Befehle müssen sicherstellen, dass die Terminal-Eingabeaufforderung mit (venv)
beginnt.
Führen Sie pip install -r requirements.txt
aus. Wenn die Eingabeaufforderung fehlschlägt, führen Sie die folgenden zwei Befehle aus, um das Pip-Image auf das Alibaba-Image umzustellen.
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
Führen Sie es dann erneut aus. Wenn Sie zur Alibaba-Bildquelle gewechselt haben und immer noch fehlschlagen, versuchen Sie es bitte pip install -r requirements.txt
Wenn Sie die CUDA-Beschleunigung verwenden möchten, führen Sie sie separat aus
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
pip install nvidia-cublas-cu11 nvidia-cudnn-cu11
Linux Wenn Sie die Cuda-Beschleunigung aktivieren möchten, müssen Sie über eine NVIDIA-Grafikkarte verfügen und die CUDA11.8+-Umgebung konfigurieren. Bitte suchen Sie nach „Linux CUDA-Installation“.
python sp.py
öffnet die Softwareschnittstelle
Öffnen Sie https://www.python.org/downloads/, um Windows 3.10 herunterzuladen. Doppelklicken Sie und klicken Sie auf „Weiter“.
Öffnen Sie ein cmd und führen Sie python -V
aus. Wenn die Ausgabe nicht 3.10.4
lautet, liegt ein Installationsfehler vor oder Add to PATH
wurde nicht hinzugefügt.
Öffnen Sie https://github.com/git-for-windows/git/releases/download/v2.45.0.windows.1/Git-2.45.0-64-bit.exe, laden Sie Git herunter und doppelklicken Sie auf „Weiter“. Schritt nach dem Herunterladen.
Suchen Sie einen Ordner ohne Leerzeichen und chinesische Zeichen, geben Sie cmd
in die Adressleiste ein und drücken Sie die Eingabetaste, öffnen Sie das Terminal und führen Sie die folgenden Befehle im Terminal aus
Führen Sie den Befehl git clone https://github.com/jianchang512/pyvideotrans
aus
Führen Sie den Befehl cd pyvideotrans
weiter aus
Fahren Sie mit der Ausführung python -m venv venv
fort
Führen Sie den Befehl .venvscriptsactivate
weiterhin aus. Überprüfen Sie nach der Ausführung, ob sich der Anfang der Befehlszeile in (venv)
geändert hat. Andernfalls ist ein Fehler aufgetreten.
Führen Sie pip install -r requirements.txt
aus. Wenn die Eingabeaufforderung fehlschlägt, führen Sie die folgenden zwei Befehle aus, um das Pip-Image auf das Alibaba-Image umzustellen.
pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com
Führen Sie es dann erneut aus. Wenn Sie zur Alibaba-Bildquelle gewechselt haben und immer noch fehlschlagen, versuchen Sie es bitte pip install -r requirements.txt
Wenn Sie die CUDA-Beschleunigung verwenden möchten, führen Sie sie separat aus
pip uninstall -y torch torchaudio
pip install torch==2.2.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cu118
Windows Wenn Sie die CUDA-Beschleunigung aktivieren möchten, müssen Sie über eine NVIDIA-Grafikkarte verfügen und die CUDA11.8+-Umgebung konfigurieren. Informationen zur spezifischen Installation finden Sie unter CUDA-Beschleunigungsunterstützung.
Entpacken Sie ffmpeg.zip in das aktuelle Quellcodeverzeichnis. Wenn Sie zum Überschreiben aufgefordert werden, stellen Sie sicher, dass ffmpeg.exe ffprobe.exe ytwin32.exe im Ordner ffmepg unter dem Quellcode angezeigt wird.
python sp.py
öffnet die Softwareschnittstelle
Die 4.x-Version von ctranslate2 wird standardmäßig verwendet und unterstützt nur die CUDA12.x-Version. Wenn Ihr Cuda niedriger als 12 ist und kein Cuda auf 12.x aktualisieren kann, führen Sie bitte den Befehl aus, um ctranslate2 zu deinstallieren und installieren Sie es dann erneut.
pip uninstall -y ctranslate2 pip install ctranslate2==3.24.0
Möglicherweise treten Fehler wie xx module not found
auf. Bitte öffnen Sie „requirements.txt“, suchen Sie nach dem „xx“-Modul und entfernen Sie nach einer Weile das == nach „xx“ und die Versionsnummer.
Quellcode-Bereitstellung/B-Station unter Mac
So richten Sie die Videoübersetzung mit Gemini Api/station b ein
Anleitung zum Herunterladen und Installieren
ChatTTS-ui: UI-Schnittstelle, die ChatTTS zum Synthetisieren von Sounds verwendet
OTT: Lokales Offline-Textübersetzungstool
Tool zum Klonen von Stimmen: Synthetisieren Sie Sprache mit jeder Klangfarbe
Spracherkennungstool: Lokales Offline-Spracherkennungstool für Text
Trennung von Gesangshintergrundmusik: Tool zur Trennung von Gesangs- und Hintergrundmusik
Verbesserte Version von api.py von GPT-SoVITS
api.py an CosyVoice angepasst
Einige Open-Source-Projekte, auf die sich dieses Programm hauptsächlich stützt
ffmpeg
PySide6
Rand-tts
schneller-flüstern
openai-flüstern
pydub