Voice-Pro: Das beste Gradio-Web-UI für Transkription, Übersetzung und Text-to-Speech?
? 한국어 ∙ Englisch ∙ 中文简体 ∙ 中文繁體 ∙ 日本語
Voice-Pro ist die beste Web-Benutzeroberfläche für Transkription, Übersetzung und Text-to-Speech. Es kann einfach mit einem Klick installiert werden. Erstellen Sie mit Miniconda eine virtuelle Umgebung, die völlig unabhängig vom Windows-System läuft (vollständig portierbar). Unterstützt Transkription und Übersetzung in Echtzeit sowie den Batch-Modus.
- YouTube-Downloader : Sie können YouTube-Videos herunterladen und den Ton extrahieren (mp3, wav, flac).
- Vocal Remover : Verwenden Sie MDX-Net, das in UVR5 unterstützt wird, und die von Meta entwickelte Demucs-Engine zur Sprachtrennung.
- STT : Unterstützt die Konvertierung von Sprache in Text mit Whisper, Faster-Whisper und Whisper-Timestamped.
- Übersetzer : Google Übersetzer.
- TTS : Text-to-Speech. Edge-TTS, F5-TTS.
- mehr...
? Bildschirm ausführen
Registerkarte TTS
: Podcast-Produktion mit F5-TTS
f5-tts-demo-elon-zuckerberg-1115-3.mp4
Registerkarte Studio
: Transkription, Übersetzung und Text-to-Speech
voice-pro-demo-v1.5.7-hevc-720p.mp4
Hauptmerkmale
- Registerkarte
Studio
.- Bietet eine integrierte Umgebung für YouTube-Downloader, Rauschunterdrückung, Untertitel, Übersetzung und TTS
- Alle von ffmpeg unterstützten Video-/Audioformate können verwendet werden
- Wählbares Ausgabe-Audioformat (WAV, FLAC, MP3)
- Spracherkennung und Untertitelerstellung für 100 Sprachen
- Wählen Sie Optionen für die Erstellung von Untertiteln aus, die für die PC-Leistung geeignet sind (Whisper-Modell und Rechentyp).
- Übersetzung in über 100 Sprachen und Sprachgenerierung durch TTS
- Die Hintergrundmusik und Soundeffekte des Originalvideos bleiben im mehrsprachigen Video erhalten.
- Unterstützt TTS-Sprachgeschwindigkeit, Lautstärke und Tonhöhenanpassung
Ausführungsumgebung
- Betriebssystem: Windows 10/11 (64 Bit) ※ Linux und Mac OS werden nicht unterstützt.
- GPU: NVIDIA -Grafikkarte mit Unterstützung von CUDA 12.1 empfohlen.
- VRAM: 4 GB oder mehr. 8 GB oder mehr empfohlen.
- RAM: 4 GB oder mehr
- Festplatte: Mindestens 20 GB freier Speicherplatz während der Installation
- Internetverbindung erforderlich (Installations- und Übersetzungsarbeiten)
? Installation
Voice-Pro lässt sich einfach mit einem Klick installieren. Führen Sie einfach configure.bat und start.bat aus
Schritt 1. Paketvorbereitung
- A. Bezahlversion
- Entpacken Sie die auf dem USB-Stick enthaltene komprimierte Datei ( voice-pro-x.zip ) an einen geeigneten Speicherort auf Ihrem Computer.
- Oder kopieren Sie den bereits entpackten Ordner ( voice-pro-x ) an einen geeigneten Speicherort auf Ihrem Computer.
- B. Kostenlose Version
- Klonen Sie die neueste Version ( Quellcode (zip) ) oder laden Sie sie herunter von
Schritt 2. Installieren Sie das Programm und führen Sie es aus
- Führen Sie
configure.bat
aus- Installieren Sie Git, ffmpeg und CUDA (bei Verwendung einer NVIDIA-GPU) unter Windows.
- Sie müssen es nur beim ersten Mal ausführen.
- Es ist eine Internetverbindung erforderlich, die je nach System mehr als eine Stunde dauern kann.
- Schließen Sie während der Installation niemals das Windows-Befehlsfenster.
- Führen Sie
start.bat
aus- Starten Sie Voice-Pro. Die Web-Benutzeroberfläche wird automatisch ausgeführt.
- Beim ersten Start wird Voice-Pro zuerst installiert.
- Es ist eine Internetverbindung erforderlich, die je nach System mehr als eine Stunde dauern kann.
- Schließen Sie während der Installation niemals das Windows-Befehlsfenster.
- Wenn während der Installation ein Problem auftritt, löschen Sie den Ordner „installer_files“ und führen Sie start.bat erneut aus.
Schritt 3. Programm deinstallieren
- Führen Sie
uninstall.bat
aus:- Entfernen Sie den Ordner installer_files .
- Entfernen Sie die unter Windows installierten ffmepg-, git- und CUDA-Pakete (falls ausgewählt).
- Voice-Pro verfügt standardmäßig über eine tragbare Installation. Um das Programm zu deinstallieren, genügt das Löschen des Installationsordners.
❓Tipps & Tricks
Wenn der Browser nicht automatisch ausgeführt wird
- Schließen Sie das Windows-Commnad-Fenster und führen Sie start.bat erneut aus.
- Starten Sie den Browser direkt und geben Sie die im Windows-Befehlsfenster angezeigte Adresse (z. B. http://127.0.0.1:7892 ) in die Adressleiste ein.
Wenn ein CUDA-Out-Of-Memory-Fehler auftritt
- Überprüfen Sie den GPU-Speicherstatus im Windows Task-Manager – Registerkarte „Leistung“.
- Stellen Sie den Rauschunterdrückungspegel auf 0 oder 1 ein. Rauschunterdrückungspegel 2 erfordert mindestens 8 GB GPU-Speicher.
- Stellen Sie den Compute-Typ auf den Typ „int“ ein. Der Float-Typ bietet eine bessere Qualität, erfordert jedoch mehr GPU-Speicher.
Wie kann die Qualität von Untertiteln verbessert werden?
- Die Qualität der Untertitel verbessert sich tendenziell bei größeren Whisper-Modellen, aber das ist nicht unbedingt der Fall. groß > mittel > klein > Basis > winzig
- Unter den Rechentypen weist der Float-Typ eine gute Leistung auf. Der Typ int ist ein Modell, das die GPU-Nutzung reduziert und die Geschwindigkeit durch Modellquantisierung erhöht. Andererseits nimmt die Leistung ab.
- Wenn Sie den Rauschunterdrückungspegel erhöhen, werden mehr Hintergrundgeräusche entfernt und nur die verbleibende Stimme wird für die Spracherkennung verwendet. Es ist nicht immer eine Garantie für gute Ergebnisse.
? Vorsicht
Windows Defender gibt möglicherweise eine Warnung vor nicht vertrauenswürdigen Anwendungen aus und verhindert die weitere Ausführung von Voice-Pro. Wenn die SmartScreen-Sicherheitsstufe auf „Warnen“ eingestellt ist, klicken Sie einfach auf „Weitere Informationen“ und dann auf „Trotzdem ausführen“. Wenn SmartScreen auf die Stufe „Blockieren“ eingestellt ist, gibt es keine Schaltfläche zum Ausführen der Installation. Öffnen Sie in diesem Fall die Eigenschaften der Datei start.bat, aktivieren Sie „Entsperren“, übernehmen Sie die Änderung und führen Sie start.bat erneut aus.
Wenn Windows Defender eine Batchdatei fälschlicherweise als Trojaner erkennt, wird dies oft als „False Positive“ bezeichnet. Um dieses Problem zu lösen, können Sie die folgenden Schritte ausführen:
- Behandlung von Dateiausnahmen: In Windows Defender können Sie festlegen, dass bestimmte Dateien oder Prozesse Sicherheitsüberprüfungen überspringen. Befolgen Sie dazu die folgenden Schritte:
- Klicken Sie auf die Schaltfläche „Start“ und gehen Sie zu „Einstellungen“.
- Klicken Sie auf „Update & Sicherheit“.
- Wählen Sie „Windows-Sicherheit“ und gehen Sie zu „Viren- und Bedrohungsschutz“.
- Klicken Sie auf „Viren- und Bedrohungsschutzeinstellungen verwalten“.
- Wählen Sie „Ausnahme hinzufügen“ in den „Einstellungen für Viren- und Bedrohungsschutz“.
- Wählen Sie „Datei oder Ordner“, suchen Sie die betreffende Batchdatei und fügen Sie sie als Ausnahme hinzu.
- Deaktivieren Sie Windows Defender vorübergehend: Dies kann eine vorübergehende Lösung sein. Allerdings müssen Sie bei der Verwendung dieser Methode vorsichtig sein, da Ihr Computer dadurch möglicherweise anderen Bedrohungen ausgesetzt wird.
- Melden Sie das Problem einer Antivirensoftware: Wenn Sie sicher sind, dass es sich bei der Datei nicht um ein Trojanisches Pferd handelt, können Sie sie als False Positive an Microsoft melden. Microsoft wird dies prüfen und alle erforderlichen Maßnahmen ergreifen.
? Kontaktieren Sie uns
- E-Mail: [email protected]
- Homepage (Koreanisch): https://abuskorea.imweb.me
- Amazon (USA): https://www.amazon.com/dp/B0DBR69JPL
- Amazon (Japan): https://www.amazon.co.jp/dp/B0DBVRJ542
- Amazon (Singapur): https://www.amazon.sg/dp/B0DCGKL8R4
- Amazon (VAE): https://www.amazon.ae/dp/B0DCGKM7FF
- Weitere Informationen zum Download (S/W): https://smartstore.naver.com/abus/products/10385660040
- 네이버 스마트스토어 (Lösung): https://smartstore.naver.com/abus/products/10298346364
? YouTube
- Produktinformationen: https://youtube.com/playlist?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq&si=873MgzUtu4POE9jO
- Heim-Karaoke (Pop): https://youtube.com/playlist?list=PLwx5dnMDVC9bVxfGo58U-R-w3fUHqwiD6&si=aWRDfF8TxFp2oAR0
- Heim-Karaoke (K-Pop): https://youtube.com/playlist?list=PLwx5dnMDVC9Z8kB01tQKfzTysaCCxC3C8&si=1_-9p722rd_JXpzv
- Heim-Karaoke (J-Pop): https://youtube.com/playlist?list=PLwx5dnMDVC9apyxrP9LE9PiT821G7lJXk&si=0a474CP7ZIjMoGN9
Credits
- Demucs: https://github.com/facebookresearch/demucs
- yt-dlp: https://github.com/yt-dlp/yt-dlp
- Gradio: https://github.com/gradio-app/gradio
- Edge-TTS: https://github.com/rany2/edge-tts
- F5-TTS: https://github.com/SWivid/F5-TTS.git
©️ Urheberrecht
von ABUS