rnnt speech recognition Télécharger - rnnt speech recognition Téléchargement du code source

rnnt speech recognition

Code Source AI

1.0.0

Télécharger

Reconnaissance vocale par transducteur RNN

Reconnaissance vocale de bout en bout à l'aide de RNN-Transducer dans Tensorflow 2.0

Aperçu

Ce modèle de reconnaissance vocale est basé sur le document de recherche Streaming End-to-end Speech Recognition For Mobile Devices de Google et est implémenté dans Python 3 à l'aide de Tensorflow 2.0.

Configurez votre environnement

Pour configurer votre environnement, exécutez la commande suivante :

 git clone --recurse https://github.com/noahchalifour/rnnt-speech-recognition.git
cd rnnt-speech-recognition
pip install tensorflow==2.2.0 # or tensorflow-gpu==2.2.0 for GPU support
pip install -r requirements.txt
./scripts/build_rnnt.sh # to setup the rnnt loss

Voix commune

Vous pouvez trouver et télécharger l’ensemble de données Common Voice ici

Convertir tous les MP3 en WAV

Avant de pouvoir entraîner un modèle sur l'ensemble de données Common Voice, vous devez d'abord convertir tous les types de fichiers audio mp3 en wav. Faites-le en exécutant la commande suivante :

REMARQUE : assurez-vous que ffmpeg est installé sur votre ordinateur, car il l'utilise pour convertir les mp3 en wav.

 ./scripts/common_voice_convert.sh <data_dir> <# of threads>
python scripts/remove_missing_samples.py 
    --data_dir <data_dir> 
    --replace_old

Ensemble de données de prétraitement

Après avoir converti tous les mp3 en wav dont vous avez besoin pour prétraiter l'ensemble de données, vous pouvez le faire en exécutant la commande suivante :

 python preprocess_common_voice.py 
    --data_dir <data_dir> 
    --output_dir <preprocessed_dir>

Entraîner un modèle

Pour entraîner un modèle simple, exécutez la commande suivante :

 python run_rnnt.py 
    --mode train 
    --data_dir <path to data directory>

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-01-28
taille 30.82KB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout