Descarga rnnt speech recognition - rnnt speech recognition Descarga del código fuente

rnnt speech recognition

Código Fuente de IA

1.0.0

Descargar

Reconocimiento de voz por transductor RNN

Reconocimiento de voz de un extremo a otro utilizando RNN-Transducer en Tensorflow 2.0

Descripción general

Este modelo de reconocimiento de voz se basa en el trabajo de investigación Streaming End-to-end Speech Recognition For Mobile Devices de Google y se implementa en Python 3 usando Tensorflow 2.0.

Configure su entorno

Para configurar su entorno, ejecute el siguiente comando:

 git clone --recurse https://github.com/noahchalifour/rnnt-speech-recognition.git
cd rnnt-speech-recognition
pip install tensorflow==2.2.0 # or tensorflow-gpu==2.2.0 for GPU support
pip install -r requirements.txt
./scripts/build_rnnt.sh # to setup the rnnt loss

Voz común

Puede encontrar y descargar el conjunto de datos de Common Voice aquí

Convierte todos los MP3 a WAV

Antes de poder entrenar un modelo en el conjunto de datos de Common Voice, primero debe convertir todos los tipos de archivos de audio mp3 a wav. Hágalo ejecutando el siguiente comando:

NOTA: asegúrese de tener ffmpeg instalado en su computadora, ya que lo usa para convertir mp3 a wav.

 ./scripts/common_voice_convert.sh <data_dir> <# of threads>
python scripts/remove_missing_samples.py 
    --data_dir <data_dir> 
    --replace_old

Conjunto de datos de preprocesamiento

Después de convertir todos los mp3 a wav que necesita para preprocesar el conjunto de datos, puede hacerlo ejecutando el siguiente comando:

 python preprocess_common_voice.py 
    --data_dir <data_dir> 
    --output_dir <preprocessed_dir>

Entrenando un modelo

Para entrenar un modelo simple, ejecute el siguiente comando:

 python run_rnnt.py 
    --mode train 
    --data_dir <path to data directory>

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-01-28
tamaño 30.82KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
node telegram bot api

Código Fuente de IA

v0.50.0
typebot.io

Código Fuente de IA

v3.1.2
python wechaty getting started

Código Fuente de IA

1.0.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo