Скачать rnnt speech recognition - rnnt speech recognition скачать исходный код

rnnt speech recognition

AI Исходный код

1.0.0

Скачать

Распознавание речи RNN-преобразователя

Сквозное распознавание речи с использованием RNN-Transducer в Tensorflow 2.0

Обзор

Эта модель распознавания речи основана на исследовательской работе Google по сквозному распознаванию речи для мобильных устройств и реализована на Python 3 с использованием Tensorflow 2.0.

Настройте свою среду

Чтобы настроить среду, выполните следующую команду:

 git clone --recurse https://github.com/noahchalifour/rnnt-speech-recognition.git
cd rnnt-speech-recognition
pip install tensorflow==2.2.0 # or tensorflow-gpu==2.2.0 for GPU support
pip install -r requirements.txt
./scripts/build_rnnt.sh # to setup the rnnt loss

Общий голос

Вы можете найти и скачать набор данных Common Voice здесь.

Конвертируйте все MP3 в WAV

Прежде чем вы сможете обучить модель на наборе данных Common Voice, вы должны сначала преобразовать все типы аудиофайлов mp3 в wavs. Сделайте это, выполнив следующую команду:

ПРИМЕЧАНИЕ. Убедитесь, что на вашем компьютере установлен ffmpeg , поскольку он использует его для преобразования mp3 в wav.

 ./scripts/common_voice_convert.sh <data_dir> <# of threads>
python scripts/remove_missing_samples.py 
    --data_dir <data_dir> 
    --replace_old

Предварительная обработка набора данных

После преобразования всех mp3-файлов в wav-файлы, которые вам необходимо предварительно обработать набор данных, вы можете сделать это, выполнив следующую команду:

 python preprocess_common_voice.py 
    --data_dir <data_dir> 
    --output_dir <preprocessed_dir>

Обучение модели

Чтобы обучить простую модель, выполните следующую команду:

 python run_rnnt.py 
    --mode train 
    --data_dir <path to data directory>

Расширять

Дополнительная информация

Версия 1.0.0
Тип AI Исходный код
Время обновления 2025-01-28
размер 30.82KB
От Github

Связанные приложения

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

rnnt speech recognition

Распознавание речи RNN-преобразователя

Обзор

Настройте свою среду

Общий голос

Конвертируйте все MP3 в WAV

Предварительная обработка набора данных

Обучение модели

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

GitHub the via/releases

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

termwind

wp functions