
Flüsterplatzplatz
Erstellen Sie sofort Echtzeit-Sprach-2Text-Apps in 99 Sprachen mit schnellerem Whisper, Diart und Pyannote
Probieren Sie es über die Online -Demo
Spielplatz.demo.mp4
Aufstellen
- Haben Sie
Conda
und Yarn
auf Ihrem Gerät - Klon oder Gabel dieses Repository
- Installieren Sie die Backend- und Frontend -Umgebung
sh install_playground.sh
- Überprüfen Sie config.py, um sicherzustellen, dass das Transkriptionsgerät mit Ihrem Setup übereinstimmt. Überprüfen Sie config.js, um sicherzustellen, dass es der Backend -Konfiguration entspricht und dass die Backend -Adresse korrekt ist.
- Führen Sie den Backend
cd backend && python server.py
aus - Führen Sie in einem anderen Terminal die React Frontend
cd interface && yarn start
aus
Zugriff auf Pyannote -Modelle
Dieses Repository verwendet Bibliotheken, die auf Pyannote.audio -Modellen basieren, die im Umarmungs -Face -Hub gespeichert sind. Sie müssen ihre Nutzungsbedingungen akzeptieren, bevor Sie sie verwenden. Hinweis: Sie müssen ein umarmendes Gesichtskonto haben, um Pyannote zu verwenden
- Akzeptieren Sie Begriffe für das
pyannote/segmentation
- Akzeptieren Sie Begriffe für das
pyannote/embedding
- Akzeptieren Sie Begriffe für das Modell
pyannote/speaker-diarization
- Installieren Sie Huggingface -CLI und melden Sie sich mit Ihrem Benutzerzugriffs -Token an (finden Sie in Einstellungen -> Zugriffstoken).
Parameter
- Modellgröße: Wählen Sie die Modellgröße von winzig bis groß-V2.
- Sprache: Wählen Sie die Sprache aus, in der Sie sprechen.
- Transkriptionszeitüberschreitung: Legen Sie die Anzahl der Sekunden ein, die die Anwendung wartet, bevor die aktuellen Audiodaten transkribiert werden.
- Balkengröße: Passen Sie die Anzahl der erzeugten und berücksichtigten Transkriptionen an, die die Genauigkeit und die Transkriptionszeitzeit beeinflussen.
- Transkriptionsmethode: Wählen Sie "Echtzeit" für Echtzeitverdienung und -Transkriptionen oder "sequentiell" für periodische Transkriptionen mit mehr Kontext.
Fehlerbehebung
- Installieren Sie bei MacOS Rost
brew install rust
und versuchen Sie es erneut.
Bekannte Fehler
- Im sequentiellen Modus kann es unkontrollierter Lautsprecher tauschen.
- Im Echtzeitmodus werden Audiodaten, die nicht dem Transkriptions-Timeout erfüllen, nicht transkribiert.
Dieses Repository wurde nicht für alle Sprachen getestet. Bitte erstellen Sie ein Problem, wenn Sie auf Probleme stoßen.
Lizenz
Dieses Repository und das Code und das Modellgewichte von Flüster werden unter der MIT -Lizenz veröffentlicht.