rnnt speech recognition下载 - rnnt speech recognition源码下载

rnnt speech recognition

Ai源码

1.0.0

下载

RNN-传感器语音识别

在 Tensorflow 2.0 中使用 RNN-Transducer 进行端到端语音识别

概述

该语音识别模型基于 Google 的移动设备流式端到端语音识别研究论文，并使用 Tensorflow 2.0 在 Python 3 中实现

设置您的环境

要设置您的环境，请运行以下命令：

 git clone --recurse https://github.com/noahchalifour/rnnt-speech-recognition.git
cd rnnt-speech-recognition
pip install tensorflow==2.2.0 # or tensorflow-gpu==2.2.0 for GPU support
pip install -r requirements.txt
./scripts/build_rnnt.sh # to setup the rnnt loss

共同声音

您可以在此处找到并下载 Common Voice 数据集

将所有 MP3 转换为 WAV

在 Common Voice 数据集上训练模型之前，必须首先将所有音频 mp3 文件类型转换为 wav。通过运行以下命令来执行此操作：

注意：确保您的计算机上安装了ffmpeg ，因为它使用它将 mp3 转换为 wav

 ./scripts/common_voice_convert.sh <data_dir> <# of threads>
python scripts/remove_missing_samples.py 
    --data_dir <data_dir> 
    --replace_old

预处理数据集

将所有 mp3 转换为 wav 后，您需要预处理数据集，可以通过运行以下命令来完成：

 python preprocess_common_voice.py 
    --data_dir <data_dir> 
    --output_dir <preprocessed_dir>

训练模型

要训练简单模型，请运行以下命令：

 python run_rnnt.py 
    --mode train 
    --data_dir <path to data directory>

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-01-28
大小 30.82KB
来自于 Github

rnnt speech recognition

RNN-传感器语音识别

概述

设置您的环境

共同声音

将所有 MP3 转换为 WAV

预处理数据集

训练模型

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

GitHub the via/releases

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

wp functions

termwind