sherpa onnx下載 - sherpa onnx原始碼下載

sherpa onnx

C/C++

v1.10.34

下載

支援的功能

語音辨識	語音合成
✔️	✔️

說話者識別	說話者分類	說話者驗證
✔️	✔️	✔️

口語識別	音訊標記	語音活動偵測
✔️	✔️	✔️

關鍵字發現	新增標點符號
✔️	✔️

支援的平台

建築學	安卓	iOS系統	視窗	macOS	作業系統	鴻蒙作業系統
x64	✔️		✔️	✔️	✔️	✔️
x86	✔️		✔️
ARM64	✔️	✔️	✔️	✔️	✔️	✔️
臂32	✔️				✔️	✔️
RISCV64					✔️

支援的程式語言

1.C++	2.C	3.Python	4. JavaScript
✔️	✔️	✔️	✔️

5.Java	6.C#	7.科特林	8.斯威夫特
✔️	✔️	✔️	✔️

9. 去吧	10. 飛鏢	11. 鐵鏽	12.帕斯卡
✔️	✔️	✔️	✔️

對於 Rust 支持，請參閱 sherpa-rs

它還支援 WebAssembly。

介紹

此存儲庫支援在本地運行以下功能

語音轉文本（即 ASR）；支援串流和非串流媒體
文字轉語音（即 TTS）
說話者分類
說話者識別
說話者驗證
口語識別
音訊標記
VAD（例如 silero-vad）
關鍵字發現

在以下平台和作業系統上：

x86、 x86_64位元 ARM、64 位元 ARM（arm64、aarch64）、RISC-V（riscv64）
Linux、macOS、Windows、openKylin
安卓、WearOS
iOS系統
鴻蒙作業系統
NodeJS
網路組裝
樹莓派
RV1126
荔枝Pi4A
願景五2
旭日X3派
愛心派
ETC

使用以下 API

C++、C、Python、Go、 C#
Java、Kotlin、JavaScript
史威夫特、鐵鏽
Dart、對象帕斯卡

Huggingface 空間的鏈接

您可以訪問以下 Huggingface 空間來嘗試 sherpa-onnx，而無需安裝任何東西。您所需要的只是一個瀏覽器。

描述	網址
說話者分類	點我
語音辨識	點我
使用 Whisper 進行語音識別	點我
語音合成	點我
產生字幕	點我
音訊標記	點我
使用 Whisper 進行口語識別	點我

我們還有使用 WebAssembly 建置的空間。下面列出了它們：

描述	抱臉空間	模型範圍空間
使用 silero-vad 進行語音活動偵測	點我	地址
使用Zipformer進行即時語音辨識（中文+英文）	點我	地址
使用 Paraformer 進行即時語音辨識（中文+英文）	點我	地址
使用 Paraformer-large 進行即時語音辨識（中文+英語+粵語）	點我	地址
即時語音辨識（英文）	點我	地址
VAD + SenseVoice 語音辨識（中文+英語+韓文+日文+粵語）	點我	地址
VAD + 語音辨識（英語），使用 Whisper tiny.en	點我	地址
VAD + 語音辨識（英語）與 Moonshine tiny	點我	地址
VAD + 語音辨識（英語），使用 Zipformer 進行 GigaSpeech 訓練	點我	地址
VAD + 語音辨識（中文），使用 Zipformer 和 WenetSpeech 進行訓練	點我	地址
VAD + 語音辨識（日文），使用 Zipformer 進行 ReazonSpeech 訓練	點我	地址
VAD + 語音辨識（泰語），使用 Zipformer 進行 GigaSpeech2 訓練	點我	地址
使用 TeleSpeech-ASR CTC 模型的 VAD + 語音辨識（中文多種方言）	點我	地址
使用 Paraformer-large 進行 VAD + 語音辨識（英文 + 中文，及多種中文方言）	點我	地址
使用 Paraformer-small 進行 VAD + 語音辨識（英文 + 中文，及多種中文方言）	點我	地址
語音合成（英語）	點我	地址
語音合成（德文）	點我	地址
說話者分類	點我	地址

預先建置 Android APK 的連結

您可以在下表中找到此儲存庫的預先建置 Android APK

描述	網址	中國用戶
說話者分類	地址	點此
串流語音識別	地址	點此
文字轉語音	地址	點此
語音活動檢測 (VAD)	地址	點此
VAD+非串流語音識別	地址	點此
二次語音辨識	地址	點此
音訊標記	地址	點此
音頻標記 (WearOS)	地址	點此
說話者識別	地址	點此
口語識別	地址	點此
關鍵字發現	地址	點此

預建 Flutter APP 的鏈接

即時語音識別

描述	網址	中國用戶
串流語音識別	地址	點此

文字轉語音

描述	網址	中國用戶
Android（arm64-v8a、armeabi-v7a、x86_64）	地址	點此
Linux (x64)	地址	點此
macOS (x64)	地址	點此
macOS（arm64）	地址	點此
Windows (x64)	地址	點此

注意：您需要從 iOS 原始碼建置。

預建 Lazarus APP 的鏈接

產生字幕

描述	網址	中國用戶
產生字幕 (生成字幕)	地址	點此

預訓練模型的連結

描述	網址
語音辨識（語音轉文字、ASR）	地址
文字轉語音 (TTS)	地址
虛擬AD	地址
關鍵字發現	地址
音訊標記	地址
說話者辨識（Speaker ID）	地址
口語辨識（Language ID）	查看語音辨識中的多語言 Whisper ASR 模型
標點	地址
說話者分割	地址

一些預先訓練的 ASR 模型（串流）

請參閱

https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-transducer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-paraformer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-ctc/index.html

了解更多型號。下表僅列出了其中的一些。

姓名	支援的語言	描述
sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20	中文、英文	參見
sherpa-onnx-streaming-zipformer-small-bilingual-zh-en-2023-02-16	中文、英文	參見
sherpa-onnx-streaming-zipformer-zh-14M-2023-02-23	中國人	適用於 Cortex A7 CPU。參見
sherpa-onnx-streaming-zipformer-en-20M-2023-02-17	英語	適用於 Cortex A7 CPU。參見
sherpa-onnx-streaming-zipformer-韓文-2024-06-16	韓國人	參見
sherpa-onnx-streaming-zipformer-fr-2023-04-14	法語	參見

一些預先訓練的 ASR 模型（非串流）

請參閱

https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-transducer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-paraformer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-ctc/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/telespeech/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/whisper/index.html

了解更多型號。下表僅列出了其中的一些。

姓名	支援的語言	描述
耳語小.en	英語	參見
月光小	英語	參見
sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17	中文、粵語、英語、韓語、日語	支援多種中文方言。參見
sherpa-onnx-paraformer-zh-2024-03-09	中文、英文	也支援多種中文方言。參見
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01	日本人	參見
夏爾巴人-onnx-nemo-感測器-giga-am-俄羅斯-2024-10-24	俄文	參見
夏爾巴人-onnx-nemo-ctc-giga-am-俄羅斯-2024-10-24	俄文	參見
夏爾巴人-onnx-zipformer-ru-2024-09-18	俄文	參見
sherpa-onnx-zipformer-韓文-2024-06-24	韓國人	參見
sherpa-onnx-zipformer-泰國-2024-06-20	泰國	參見
sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04	中國人	支持多種方言。參見