sherpa onnx
v1.10.34
語音辨識 | 語音合成 |
---|---|
✔️ | ✔️ |
說話者識別 | 說話者分類 | 說話者驗證 |
---|---|---|
✔️ | ✔️ | ✔️ |
口語識別 | 音訊標記 | 語音活動偵測 |
---|---|---|
✔️ | ✔️ | ✔️ |
關鍵字發現 | 新增標點符號 |
---|---|
✔️ | ✔️ |
建築學 | 安卓 | iOS系統 | 視窗 | macOS | 作業系統 | 鴻蒙作業系統 |
---|---|---|---|---|---|---|
x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
x86 | ✔️ | ✔️ | ||||
ARM64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
臂32 | ✔️ | ✔️ | ✔️ | |||
RISCV64 | ✔️ |
1.C++ | 2.C | 3.Python | 4. JavaScript |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
5.Java | 6.C# | 7.科特林 | 8.斯威夫特 |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
9. 去吧 | 10. 飛鏢 | 11. 鐵鏽 | 12.帕斯卡 |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
對於 Rust 支持,請參閱 sherpa-rs
它還支援 WebAssembly。
此存儲庫支援在本地運行以下功能
在以下平台和作業系統上:
x86_64
位元 ARM、64 位元 ARM(arm64、aarch64)、RISC-V(riscv64)使用以下 API
C#
描述 | 網址 |
---|---|
說話者分類 | 點我 |
語音辨識 | 點我 |
使用 Whisper 進行語音識別 | 點我 |
語音合成 | 點我 |
產生字幕 | 點我 |
音訊標記 | 點我 |
使用 Whisper 進行口語識別 | 點我 |
我們還有使用 WebAssembly 建置的空間。下面列出了它們:
描述 | 抱臉空間 | 模型範圍空間 |
---|---|---|
使用 silero-vad 進行語音活動偵測 | 點我 | 地址 |
使用Zipformer進行即時語音辨識(中文+英文) | 點我 | 地址 |
使用 Paraformer 進行即時語音辨識(中文+英文) | 點我 | 地址 |
使用 Paraformer-large 進行即時語音辨識(中文+英語+粵語) | 點我 | 地址 |
即時語音辨識(英文) | 點我 | 地址 |
VAD + SenseVoice 語音辨識(中文+英語+韓文+日文+粵語) | 點我 | 地址 |
VAD + 語音辨識(英語),使用 Whisper tiny.en | 點我 | 地址 |
VAD + 語音辨識(英語)與 Moonshine tiny | 點我 | 地址 |
VAD + 語音辨識(英語),使用 Zipformer 進行 GigaSpeech 訓練 | 點我 | 地址 |
VAD + 語音辨識(中文),使用 Zipformer 和 WenetSpeech 進行訓練 | 點我 | 地址 |
VAD + 語音辨識(日文),使用 Zipformer 進行 ReazonSpeech 訓練 | 點我 | 地址 |
VAD + 語音辨識(泰語),使用 Zipformer 進行 GigaSpeech2 訓練 | 點我 | 地址 |
使用 TeleSpeech-ASR CTC 模型的 VAD + 語音辨識(中文多種方言) | 點我 | 地址 |
使用 Paraformer-large 進行 VAD + 語音辨識(英文 + 中文,及多種中文方言) | 點我 | 地址 |
使用 Paraformer-small 進行 VAD + 語音辨識(英文 + 中文,及多種中文方言) | 點我 | 地址 |
語音合成(英語) | 點我 | 地址 |
語音合成(德文) | 點我 | 地址 |
說話者分類 | 點我 | 地址 |
描述 | 網址 | 中國用戶 |
---|---|---|
說話者分類 | 地址 | 點此 |
串流語音識別 | 地址 | 點此 |
文字轉語音 | 地址 | 點此 |
語音活動檢測 (VAD) | 地址 | 點此 |
VAD+非串流語音識別 | 地址 | 點此 |
二次語音辨識 | 地址 | 點此 |
音訊標記 | 地址 | 點此 |
音頻標記 (WearOS) | 地址 | 點此 |
說話者識別 | 地址 | 點此 |
口語識別 | 地址 | 點此 |
關鍵字發現 | 地址 | 點此 |
描述 | 網址 | 中國用戶 |
---|---|---|
串流語音識別 | 地址 | 點此 |
描述 | 網址 | 中國用戶 |
---|---|---|
Android(arm64-v8a、armeabi-v7a、x86_64) | 地址 | 點此 |
Linux (x64) | 地址 | 點此 |
macOS (x64) | 地址 | 點此 |
macOS(arm64) | 地址 | 點此 |
Windows (x64) | 地址 | 點此 |
注意:您需要從 iOS 原始碼建置。
描述 | 網址 | 中國用戶 |
---|---|---|
產生字幕 (生成字幕) | 地址 | 點此 |
描述 | 網址 |
---|---|
語音辨識(語音轉文字、ASR) | 地址 |
文字轉語音 (TTS) | 地址 |
虛擬AD | 地址 |
關鍵字發現 | 地址 |
音訊標記 | 地址 |
說話者辨識(Speaker ID) | 地址 |
口語辨識(Language ID) | 查看語音辨識中的多語言 Whisper ASR 模型 |
標點 | 地址 |
說話者分割 | 地址 |
請參閱
了解更多型號。下表僅列出了其中的一些。
姓名 | 支援的語言 | 描述 |
---|---|---|
sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20 | 中文、英文 | 參見 |
sherpa-onnx-streaming-zipformer-small-bilingual-zh-en-2023-02-16 | 中文、英文 | 參見 |
sherpa-onnx-streaming-zipformer-zh-14M-2023-02-23 | 中國人 | 適用於 Cortex A7 CPU。參見 |
sherpa-onnx-streaming-zipformer-en-20M-2023-02-17 | 英語 | 適用於 Cortex A7 CPU。參見 |
sherpa-onnx-streaming-zipformer-韓文-2024-06-16 | 韓國人 | 參見 |
sherpa-onnx-streaming-zipformer-fr-2023-04-14 | 法語 | 參見 |
請參閱
了解更多型號。下表僅列出了其中的一些。
姓名 | 支援的語言 | 描述 |
---|---|---|
耳語小.en | 英語 | 參見 |
月光小 | 英語 | 參見 |
sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17 | 中文、粵語、英語、韓語、日語 | 支援多種中文方言。參見 |
sherpa-onnx-paraformer-zh-2024-03-09 | 中文、英文 | 也支援多種中文方言。參見 |
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | 日本人 | 參見 |
夏爾巴人-onnx-nemo-感測器-giga-am-俄羅斯-2024-10-24 | 俄文 | 參見 |
夏爾巴人-onnx-nemo-ctc-giga-am-俄羅斯-2024-10-24 | 俄文 | 參見 |
夏爾巴人-onnx-zipformer-ru-2024-09-18 | 俄文 | 參見 |
sherpa-onnx-zipformer-韓文-2024-06-24 | 韓國人 | 參見 |
sherpa-onnx-zipformer-泰國-2024-06-20 | 泰國 | 參見 |
sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04 | 中國人 | 支持多種方言。參見 |
新一代Kaldi微信交流群與QQ交流群請參考https://k2-fsa.github.io/sherpa/social-groups.html。
它展示瞭如何將 ASR 和 TTS Python API 與 FastAPI 結合使用。
使用 C# 中的串流 ASR 和圖形使用者介面。
中文影片示範:【】Windows即時字幕軟體開源(網課/開會必備)
它使用 sherpa-onnx 的 JavaScript API 以及 Electron
中文影片示範:爆了!