obs localvocal Télécharger - obs localvocal Téléchargement du code source

obs localvocal

Autre code source

OBS

Télécharger

LocalVocal - Plugin OBS pour l'assistant Speech AI

Télécharger:

Introduction

LocalVocal vous permet de transcrire, localement sur votre machine, la parole en texte et de la traduire simultanément dans n'importe quelle langue. ✅ Aucun GPU requis, ✅ aucun coût cloud, ✅ aucun réseau et ✅ aucun temps d'arrêt ! La confidentialité avant tout : toutes les données restent sur votre ordinateur.

Si ce plugin gratuit a été utile, envisagez d'ajouter un ⭐ à ce dépôt GH, de le noter sur OBS, de vous abonner à ma chaîne YouTube où je publie des mises à jour et de soutenir mon travail sur GitHub, Patreon ou OpenCollective ?

En interne, le plugin exécute Whisper d'OpenAI pour traiter le discours en temps réel et prédire une transcription. Il utilise le projet Whisper.cpp de ggerganov pour exécuter efficacement le réseau Whisper sur les CPU et les GPU. La traduction se fait avec CTranslate2.

Usage

Faites-en plus avec LocalVocal :

Traduction en temps réel
Traduire la légende de n'importe quelle application
Traduction en temps réel avec DeepL
Traduction en temps réel avec OpenAI
ChatGPT + synthèse vocale
PUBLIER des sous-titres sur YouTube
Traduction locale en temps réel LLM
Tutoriel d'utilisation

Caractéristiques actuelles :

Transcrivez l'audio en texte en temps réel dans 100 langues
Afficher les légendes à l'écran à l'aide de sources de texte
Envoyez des sous-titres vers un fichier .txt ou .srt (pour lecture par des sources externes ou lecture vidéo) avec et sans option d'agrégation
Sous-titres synchronisés avec les horodatages d'enregistrement OBS
Envoyer des sous-titres sur un flux RTMP vers, par exemple, YouTube, Twitch
Apportez votre propre modèle Whisper (n'importe quel GGML)
Traduisez les sous-titres en temps réel dans les principales langues (traduction intégrée Whisper ainsi que modèles NMT)
Prise en charge des accélérations CUDA, hipBLAS (AMD ROCm), Apple Arm64, AVX et SSE
Filtrer ou remplacer toute partie des sous-titres produits
Transcriptions partielles pour une expérience de sous-titres en streaming
Des centaines de modèles Whisper affinés pour des dizaines de langues de HuggingFace

Feuille de route :

Options de traduction intégrées plus robustes
Options de sortie supplémentaires : .vtt, .ssa, .sub, etc.
Diarisation des locuteurs (détection des locuteurs dans un flux audio multi-personnes)

Découvrez nos autres plugins :

La suppression de l'arrière-plan supprime l'arrière-plan de la webcam sans écran vert.
Détecter détectera et suivra plus de 80 types d'objets en temps réel dans OBS
CleanStream pour la suppression des mots de remplissage en temps réel (euh, euh) et des grossièretés d'un flux audio en direct
Source URL/API qui permet de récupérer des données en direct à partir d'une API et de les afficher dans OBS.
Squawk ajoute des capacités de synthèse vocale locales réalistes intégrées à OBS

Télécharger

Consultez les dernières versions pour les téléchargements et les instructions d'installation.

Modèles

Le plugin est livré avec le modèle Tiny.en et téléchargera de manière autonome d'autres modèles Whisper via une liste déroulante. Il existe également une option pour sélectionner un fichier de modèle GGML Whisper externe si vous l'avez sur le disque.

Obtenez plus de modèles sur https://ggml.ggerganov.com/ et HuggingFace, suivez les instructions sur murmur.cpp pour créer vos propres modèles ou téléchargez-en d'autres tels que des modèles distillés.

Bâtiment

Le plugin a été construit et testé sur Mac OSX (Intel & Apple Silicon), Windows (avec et sans Nvidia CUDA) et Linux.

Commencez par cloner ce dépôt dans un répertoire de votre choix.

MacOSX

À l'aide des scripts de pipeline CI, vous appelleriez simplement localement le script zsh, qui est construit pour l'architecture spécifiée dans $MACOS_ARCH (soit x86_64 , soit arm64 ).

 $ MACOS_ARCH="x86_64" ./.github/scripts/build-macos -c Libération

Installer

Le script ci-dessus devrait réussir et les fichiers du plugin (par exemple obs-localvocal.plugin ) résideront dans le dossier ./release/Release hors de la racine. Copiez le fichier .plugin dans le répertoire OBS, par exemple ~/Library/Application Support/obs-studio/plugins .

Pour obtenir le fichier d'installation .pkg , exécutez par exemple

 $ ./.github/scripts/package-macos -c Libération

(Notez que peut-être les sorties seront dans le dossier Release et non dans le dossier install comme pakage-macos l'attend, vous devrez donc renommer le dossier de build_x86_64/Release à build_x86_64/install )

Linux

Ubuntu

Pour réussir à construire sur Ubuntu, clonez d'abord le dépôt, puis depuis le répertoire du dépôt :

 $ sudo apt install -y libssl-dev
$ ./.github/scripts/build-linux

Copiez les résultats dans les dossiers OBS standard sur Ubuntu

 $ sudo cp -R release/RelWithDebInfo/lib/* /usr/lib/
$ sudo cp -R release/RelWithDebInfo/share/* /usr/share/

Remarque : Le guide officiel des plugins OBS recommande d'ajouter des plugins au dossier ~/.config/obs-studio/plugins . Cela a à voir avec la façon dont vous avez installé OBS.

Si ce qui précède ne fonctionne pas, essayez de copier les fichiers dans le dossier ~/.config :

 $ mkdir -p ~/.config/obs-studio/plugins/obs-localvocal/bin/64bit
$ cp -R release/RelWithDebInfo/lib/x86_64-linux-gnu/obs-plugins/* ~/.config/obs-studio/plugins/obs-localvocal/bin/64bit/
$ mkdir -p ~/.config/obs-studio/plugins/obs-localvocal/data
$ cp -R release/RelWithDebInfo/share/obs/obs-plugins/obs-localvocal/* ~/.config/obs-studio/plugins/obs-localvocal/data/

Autres distributions

Pour les autres distributions sur lesquelles vous ne pouvez pas utiliser le script de build CI, vous pouvez créer le plugin comme suit

Clonez le référentiel et installez ces dépendances à l'aide du gestionnaire de packages de votre distribution :

libssl (avec en-têtes de développement)

Générez les scripts de build CMake (ajustez les dossiers si nécessaire)

 cmake -B build-dir --preset linux-x86_64 -DUSE_SYSTEM_CURL=ON -DCMAKE_INSTALL_PREFIX=./output_dir

Créez le plugin et copiez les fichiers dans le répertoire de sortie
```
 cmake --build build-dir --target installer
```
Copier le plugin dans le dossier des plugins OBS
```
 mkdir -p ~/.config/obs-studio/plugins/bin/64bit
cp -R ./output_dir/lib/obs-plugins/* ~/.config/obs-studio/plugins/bin/64bit/
```
NB En fonction de votre système, le plugin peut être plutôt dans ./output_dir/lib64/obs-plugins .

Copiez les données du plugin dans le dossier des plugins OBS - Peut-être nécessaire uniquement lors de la première installation

 mkdir -p ~/.config/obs-studio/plugins/data
cp -R ./output_dir/share/obs/obs-plugins/obs-localvocal/* ~/.config/obs-studio/plugins/data/

Fenêtres

Utilisez à nouveau les scripts CI, par exemple :

 > .github/scripts/Build-Windows.ps1 -Version de configuration

La version doit exister dans le dossier ./release à la racine. Vous pouvez installer manuellement les fichiers dans le répertoire OBS.

 > Copier l'élément -Recurse -Force "releaseRelease*" -Destination "C:Program Filesobs-studio"

Construire avec la prise en charge de CUDA sous Windows

LocalVocal sera désormais automatiquement construit avec la prise en charge de CUDA via un binaire prédéfini de Whisper.cpp à partir de https://github.com/locaal-ai/locaal-ai-dep-whispercpp. Les scripts CMake téléchargeront tous les fichiers nécessaires.

Pour construire avec cuda, ajoutez ACCELERATION comme variable d'environnement (avec cpu , hipblas ou cuda ) et construisez régulièrement

 > $env:ACCELERATION="cuda"> .github/scripts/Build-Windows.ps1 -Version de configuration

Développer

Informations supplémentaires

Version OBS
Type Autre code source
Date de mise à jour 2024-11-07
taille 50MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Note Studio

2024-02-23
Studio OBS2023

2024-02-23
Système de diffusion financière en direct 2022, système d'appel de commande, système de salle de discussion de conférence, code source de la salle de diffusion financière en direct, code source de

2022-12-02

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
SmartTube

Autre code source

24.71 Stable
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
wp functions

Autres catégories

1.0.0
termwind

Autres catégories

v2.3.0

Actualités connexes Tout