sherpa onnx下载 - sherpa onnx源代码下载

sherpa onnx

C/C++

v1.10.34

下载

支持的功能

语音识别	语音合成
✔️	✔️

说话人识别	说话人分类	说话人验证
✔️	✔️	✔️

口语识别	音频标记	语音活动检测
✔️	✔️	✔️

关键词发现	添加标点符号
✔️	✔️

支持的平台

建筑学	安卓	iOS系统	视窗	macOS	操作系统	鸿蒙操作系统
x64	✔️		✔️	✔️	✔️	✔️
x86	✔️		✔️
ARM64	✔️	✔️	✔️	✔️	✔️	✔️
臂32	✔️				✔️	✔️
RISCV64					✔️

支持的编程语言

1.C++	2.C	3.Python	4. JavaScript
✔️	✔️	✔️	✔️

5.Java	6.C#	7.科特林	8.斯威夫特
✔️	✔️	✔️	✔️

9. 去吧	10. 飞镖	11. 铁锈	12.帕斯卡
✔️	✔️	✔️	✔️

对于 Rust 支持，请参阅 sherpa-rs

它还支持 WebAssembly。

介绍

该存储库支持在本地运行以下功能

语音转文本（即 ASR）；支持流式传输和非流式传输
文本转语音（即 TTS）
说话人分类
说话人识别
说话人验证
口语识别
音频标记
VAD（例如 silero-vad）
关键词发现

在以下平台和操作系统上：

x86、 x86_64位 ARM、64 位 ARM（arm64、aarch64）、RISC-V（riscv64）
Linux、macOS、Windows、openKylin
安卓、WearOS
iOS系统
鸿蒙操作系统
NodeJS
网络组装
树莓派
RV1126
荔枝Pi4A
愿景五2
旭日X3派
爱芯派
ETC

使用以下 API

C++、C、Python、Go、 C#
Java、Kotlin、JavaScript
斯威夫特、铁锈
Dart、对象帕斯卡

Huggingface 空间的链接

您可以访问以下 Huggingface 空间来尝试 sherpa-onnx，而无需安装任何东西。您所需要的只是一个浏览器。

描述	网址
说话人分类	点我
语音识别	点我
使用 Whisper 进行语音识别	点我
语音合成	点我
生成字幕	点我
音频标记	点我
使用 Whisper 进行口语识别	点我

我们还有使用 WebAssembly 构建的空间。下面列出了它们：

描述	抱脸空间	模型范围空间
使用 silero-vad 进行语音活动检测	点我	地址
使用Zipformer进行实时语音识别（中文+英文）	点我	地址
使用 Paraformer 进行实时语音识别（中文+英文）	点我	地址
使用 Paraformer-large 进行实时语音识别（中文+英语+粤语）	点我	地址
实时语音识别（英文）	点我	地址
VAD + SenseVoice 语音识别（中文+英语+韩语+日语+粤语）	点我	地址
VAD + 语音识别（英语），使用 Whisper tiny.en	点我	地址
VAD + 语音识别（英语）与 Moonshine tiny	点我	地址
VAD + 语音识别（英语），使用 Zipformer 进行 GigaSpeech 训练	点我	地址
VAD + 语音识别（中文），使用 Zipformer 和 WenetSpeech 进行训练	点我	地址
VAD + 语音识别（日语），使用 Zipformer 进行 ReazonSpeech 训练	点我	地址
VAD + 语音识别（泰语），使用 Zipformer 进行 GigaSpeech2 训练	点我	地址
使用 TeleSpeech-ASR CTC 模型的 VAD + 语音识别（中文多种方言）	点我	地址
使用 Paraformer-large 进行 VAD + 语音识别（英语 + 中文，及多种中文方言）	点我	地址
使用 Paraformer-small 进行 VAD + 语音识别（英语 + 中文，及多种中文方言）	点我	地址
语音合成（英语）	点我	地址
语音合成（德语）	点我	地址
说话人分类	点我	地址

预构建 Android APK 的链接

您可以在下表中找到此存储库的预构建 Android APK

描述	网址	中国用户
说话人分类	地址	点此
流式语音识别	地址	点此
文字转语音	地址	点此
语音活动检测 (VAD)	地址	点此
VAD+非流式语音识别	地址	点此
二次语音识别	地址	点此
音频标记	地址	点此
音频标记 (WearOS)	地址	点此
说话人识别	地址	点此
口语识别	地址	点此
关键词发现	地址	点此

预构建 Flutter APP 的链接

实时语音识别

描述	网址	中国用户
流式语音识别	地址	点此

文字转语音

描述	网址	中国用户
Android（arm64-v8a、armeabi-v7a、x86_64）	地址	点此
Linux (x64)	地址	点此
macOS (x64)	地址	点此
macOS（arm64）	地址	点此
Windows (x64)	地址	点此

注意：您需要从 iOS 源代码构建。

预建 Lazarus APP 的链接

生成字幕

描述	网址	中国用户
生成字幕 (生成字幕)	地址	点此

预训练模型的链接

描述	网址
语音识别（语音转文本、ASR）	地址
文本转语音 (TTS)	地址
虚拟AD	地址
关键词发现	地址
音频标记	地址
说话人识别（Speaker ID）	地址
口语识别（Language ID）	查看语音识别中的多语言 Whisper ASR 模型
标点	地址
说话人分割	地址

一些预训练的 ASR 模型（流式传输）

请参阅

https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-transducer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-paraformer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-ctc/index.html

了解更多型号。下表仅列出了其中的一些。

姓名	支持的语言	描述
sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20	中文、英文	参见
sherpa-onnx-streaming-zipformer-small-bilingual-zh-en-2023-02-16	中文、英文	参见
sherpa-onnx-streaming-zipformer-zh-14M-2023-02-23	中国人	适用于 Cortex A7 CPU。参见
sherpa-onnx-streaming-zipformer-en-20M-2023-02-17	英语	适用于 Cortex A7 CPU。参见
sherpa-onnx-streaming-zipformer-韩语-2024-06-16	韩国人	参见
sherpa-onnx-streaming-zipformer-fr-2023-04-14	法语	参见

一些预训练的 ASR 模型（非流式传输）

请参阅

https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-transducer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-paraformer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-ctc/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/telespeech/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/whisper/index.html

了解更多型号。下表仅列出了其中的一些。

姓名	支持的语言	描述
耳语小.en	英语	参见
月光小	英语	参见
sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17	中文、粤语、英语、韩语、日语	支持多种中文方言。参见
sherpa-onnx-paraformer-zh-2024-03-09	中文、英文	也支持多种中文方言。参见
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01	日本人	参见
夏尔巴人-onnx-nemo-传感器-giga-am-俄罗斯-2024-10-24	俄语	参见
夏尔巴人-onnx-nemo-ctc-giga-am-俄罗斯-2024-10-24	俄语	参见
夏尔巴人-onnx-zipformer-ru-2024-09-18	俄语	参见
sherpa-onnx-zipformer-韩语-2024-06-24	韩国人	参见
sherpa-onnx-zipformer-泰国-2024-06-20	泰国	参见
sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04	中国人	支持多种方言。参见

有用的链接

文档：https://k2-fsa.github.io/sherpa/onnx/
B站演示视频：https://search.bilibili.com/all?keyword=%E6%96%B0%E4%B8%80%E4%BB%A3Kaldi

如何联系我们

新一代Kaldi微信交流群和QQ交流群请参见https://k2-fsa.github.io/sherpa/social-groups.html。

使用 sherpa-onnx 的项目

语音API

基于FastAPI的流式ASR和TTS

它展示了如何将 ASR 和 TTS Python API 与 FastAPI 结合使用。

腾讯会议摸鱼工具 TMSpeech

使用 C# 中的流式 ASR 和图形用户界面。

中文视频演示：【】Windows实时字幕软件开源（网课/开会必备）

哈哈互动助手

它使用 sherpa-onnx 的 JavaScript API 以及 Electron

中文视频演示：爆了！炫神教你开发型挂！真正影响胜率的英雄联盟工具！英雄联盟的最后一块拼图！和游戏中的每个人无障碍沟通！

展开

附加信息

版本 v1.10.34
类型 C/C++
更新时间 2024-12-27
大小 9.43MB
来自于 Github

sherpa onnx

支持的功能

支持的平台

支持的编程语言

介绍

Huggingface 空间的链接

预构建 Android APK 的链接

预构建 Flutter APP 的链接

实时语音识别

文字转语音

预建 Lazarus APP 的链接

生成字幕

预训练模型的链接

一些预训练的 ASR 模型（流式传输）

一些预训练的 ASR 模型（非流式传输）

有用的链接

如何联系我们

使用 sherpa-onnx 的项目

语音API

腾讯会议摸鱼工具 TMSpeech

哈哈互动助手

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

GitHub the via/releases

chat.petals.dev

GPT Prompt Templates

GPTyped

cpp peglib

vkhr

carma platform

waymo open dataset

termwind

wp functions