whisper playground Download - whisper playground Quellcode herunterladen

whisper playground

Anderer Quellcode

VAD support

Herunterladen

Flüsterplatzplatz

Erstellen Sie sofort Echtzeit-Sprach-2Text-Apps in 99 Sprachen mit schnellerem Whisper, Diart und Pyannote

Probieren Sie es über die Online -Demo

Spielplatz.demo.mp4

Aufstellen

Haben Sie Conda und Yarn auf Ihrem Gerät
Klon oder Gabel dieses Repository
Installieren Sie die Backend- und Frontend -Umgebung sh install_playground.sh
Überprüfen Sie config.py, um sicherzustellen, dass das Transkriptionsgerät mit Ihrem Setup übereinstimmt. Überprüfen Sie config.js, um sicherzustellen, dass es der Backend -Konfiguration entspricht und dass die Backend -Adresse korrekt ist.
Führen Sie den Backend cd backend && python server.py aus
Führen Sie in einem anderen Terminal die React Frontend cd interface && yarn start aus

Zugriff auf Pyannote -Modelle

Dieses Repository verwendet Bibliotheken, die auf Pyannote.audio -Modellen basieren, die im Umarmungs -Face -Hub gespeichert sind. Sie müssen ihre Nutzungsbedingungen akzeptieren, bevor Sie sie verwenden. Hinweis: Sie müssen ein umarmendes Gesichtskonto haben, um Pyannote zu verwenden

Akzeptieren Sie Begriffe für das pyannote/segmentation
Akzeptieren Sie Begriffe für das pyannote/embedding
Akzeptieren Sie Begriffe für das Modell pyannote/speaker-diarization
Installieren Sie Huggingface -CLI und melden Sie sich mit Ihrem Benutzerzugriffs -Token an (finden Sie in Einstellungen -> Zugriffstoken).

Parameter

Modellgröße: Wählen Sie die Modellgröße von winzig bis groß-V2.
Sprache: Wählen Sie die Sprache aus, in der Sie sprechen.
Transkriptionszeitüberschreitung: Legen Sie die Anzahl der Sekunden ein, die die Anwendung wartet, bevor die aktuellen Audiodaten transkribiert werden.
Balkengröße: Passen Sie die Anzahl der erzeugten und berücksichtigten Transkriptionen an, die die Genauigkeit und die Transkriptionszeitzeit beeinflussen.
Transkriptionsmethode: Wählen Sie "Echtzeit" für Echtzeitverdienung und -Transkriptionen oder "sequentiell" für periodische Transkriptionen mit mehr Kontext.

Fehlerbehebung

Installieren Sie bei MacOS Rost brew install rust und versuchen Sie es erneut.

Bekannte Fehler

Im sequentiellen Modus kann es unkontrollierter Lautsprecher tauschen.
Im Echtzeitmodus werden Audiodaten, die nicht dem Transkriptions-Timeout erfüllen, nicht transkribiert.

Dieses Repository wurde nicht für alle Sprachen getestet. Bitte erstellen Sie ein Problem, wenn Sie auf Probleme stoßen.