Spracherkennung | Sprachsynthese |
---|---|
✔️ | ✔️ |
Identifizierung des Sprechers | Sprechertagebuch | Überprüfung des Sprechers |
---|---|---|
✔️ | ✔️ | ✔️ |
Identifizierung der gesprochenen Sprache | Audio-Tagging | Erkennung von Sprachaktivitäten |
---|---|---|
✔️ | ✔️ | ✔️ |
Keyword-Spotting | Satzzeichen hinzufügen |
---|---|
✔️ | ✔️ |
Architektur | Android | iOS | Windows | macOS | Linux | HarmonyOS |
---|---|---|---|---|---|---|
x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
x86 | ✔️ | ✔️ | ||||
arm64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
arm32 | ✔️ | ✔️ | ✔️ | |||
riscv64 | ✔️ |
1. C++ | 2. C | 3. Python | 4. JavaScript |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
5. Java | 6. C# | 7. Kotlin | 8. Schnell |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
9. Geh | 10. Dart | 11. Rost | 12. Pascal |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
Informationen zur Rust-Unterstützung finden Sie unter sherpa-rs
Es unterstützt auch WebAssembly.
Dieses Repository unterstützt die lokale Ausführung der folgenden Funktionen
auf folgenden Plattformen und Betriebssystemen:
x86_64
, 32-Bit-ARM, 64-Bit-ARM (arm64, aarch64), RISC-V (riscv64)mit den folgenden APIs
C#
Beschreibung | URL |
---|---|
Sprechertagebuch | Klicken Sie auf mich |
Spracherkennung | Klicken Sie auf mich |
Spracherkennung mit Whisper | Klicken Sie auf mich |
Sprachsynthese | Klicken Sie auf mich |
Untertitel generieren | Klicken Sie auf mich |
Audio-Tagging | Klicken Sie auf mich |
Identifizierung der gesprochenen Sprache mit Whisper | Klicken Sie auf mich |
Wir haben auch Räume, die mit WebAssembly erstellt wurden. Sie sind unten aufgeführt:
Beschreibung | Umarmender Gesichtsraum | ModelScope-Bereich |
---|---|---|
Sprachaktivitätserkennung mit Silero-Vad | Klicken Sie auf mich | 地址 |
Echtzeit-Spracherkennung (Chinesisch + Englisch) mit Zipformer | Klicken Sie auf mich | 地址 |
Echtzeit-Spracherkennung (Chinesisch + Englisch) mit Paraformer | Klicken Sie auf mich | 地址 |
Echtzeit-Spracherkennung (Chinesisch + Englisch + Kantonesisch) mit Paraformer-large | Klicken Sie auf mich | 地址 |
Echtzeit-Spracherkennung (Englisch) | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Chinesisch + Englisch + Koreanisch + Japanisch + Kantonesisch) mit SenseVoice | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Englisch) mit Whisper tiny.en | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Englisch) mit Moonshine tiny | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Englisch) mit Zipformer, trainiert mit GigaSpeech | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Chinesisch) mit Zipformer, trainiert mit WenetSpeech | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Japanisch) mit Zipformer, trainiert mit ReazonSpeech | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Thai) mit Zipformer, trainiert mit GigaSpeech2 | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Chinesisch 多种方言) mit einem TeleSpeech-ASR CTC-Modell | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Englisch + Chinesisch, 及多种中文方言) mit Paraformer-large | Klicken Sie auf mich | 地址 |
VAD + Spracherkennung (Englisch + Chinesisch, 及多种中文方言) mit Paraformer-small | Klicken Sie auf mich | 地址 |
Sprachsynthese (Englisch) | Klicken Sie auf mich | 地址 |
Sprachsynthese (Deutsch) | Klicken Sie auf mich | 地址 |
Sprechertagebuch | Klicken Sie auf mich | 地址 |
Beschreibung | URL | 中国用户 |
---|---|---|
Sprechertagebuch | Adresse | 点此 |
Streaming-Spracherkennung | Adresse | 点此 |
Text-zu-Sprache | Adresse | 点此 |
Sprachaktivitätserkennung (VAD) | Adresse | 点此 |
VAD + Nicht-Streaming-Spracherkennung | Adresse | 点此 |
Spracherkennung in zwei Durchgängen | Adresse | 点此 |
Audio-Tagging | Adresse | 点此 |
Audio-Tagging (WearOS) | Adresse | 点此 |
Identifizierung des Sprechers | Adresse | 点此 |
Identifizierung der gesprochenen Sprache | Adresse | 点此 |
Keyword-Spotting | Adresse | 点此 |
Beschreibung | URL | 中国用户 |
---|---|---|
Streaming-Spracherkennung | Adresse | 点此 |
Beschreibung | URL | 中国用户 |
---|---|---|
Android (arm64-v8a, armeabi-v7a, x86_64) | Adresse | 点此 |
Linux (x64) | Adresse | 点此 |
macOS (x64) | Adresse | 点此 |
macOS (arm64) | Adresse | 点此 |
Windows (x64) | Adresse | 点此 |
Hinweis: Sie müssen für iOS aus dem Quellcode erstellen.
Beschreibung | URL | 中国用户 |
---|---|---|
Untertitel generieren (生成字幕) | Adresse | 点此 |
Beschreibung | URL |
---|---|
Spracherkennung (speech to text, ASR) | Adresse |
Text-to-Speech (TTS) | Adresse |
VAD | Adresse |
Keyword-Spotting | Adresse |
Audio-Tagging | Adresse |
Sprecheridentifikation (Sprecher-ID) | Adresse |
Identifizierung der gesprochenen Sprache (Sprach-ID) | Sehen Sie sich mehrsprachige Whisper ASR-Modelle aus der Spracherkennung an |
Interpunktion | Adresse |
Sprechersegmentierung | Adresse |
Bitte sehen
für weitere Modelle. In der folgenden Tabelle sind nur EINIGE davon aufgeführt.
Name | Unterstützte Sprachen | Beschreibung |
---|---|---|
sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20 | Chinesisch, Englisch | Siehe auch |
sherpa-onnx-streaming-zipformer-small-bilingual-zh-en-2023-02-16 | Chinesisch, Englisch | Siehe auch |
sherpa-onnx-streaming-zipformer-zh-14M-2023-02-23 | chinesisch | Geeignet für Cortex A7-CPU. Siehe auch |
sherpa-onnx-streaming-zipformer-en-20M-2023-02-17 | Englisch | Geeignet für Cortex A7-CPU. Siehe auch |
Sherpa-onnx-streaming-zipformer-koreanisch-2024-06-16 | Koreanisch | Siehe auch |
Sherpa-onnx-streaming-zipformer-fr-2023-04-14 | Französisch | Siehe auch |
Bitte sehen
für weitere Modelle. In der folgenden Tabelle sind nur EINIGE davon aufgeführt.
Name | Unterstützte Sprachen | Beschreibung |
---|---|---|
Whisper tiny.en | Englisch | Siehe auch |
Mondschein winzig | Englisch | Siehe auch |
sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17 | Chinesisch, Kantonesisch, Englisch, Koreanisch, Japanisch | 支持多种中文方言. Siehe auch |
sherpa-onnx-paraformer-zh-2024-03-09 | Chinesisch, Englisch | 也支持多种中文方言. Siehe auch |
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | japanisch | Siehe auch |
Sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24 | Russisch | Siehe auch |
Sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24 | Russisch | Siehe auch |
sherpa-onnx-zipformer-ru-2024-09-18 | Russisch | Siehe auch |
Sherpa-onnx-zipformer-koreanisch-2024-06-24 | Koreanisch | Siehe auch |
sherpa-onnx-zipformer-thai-2024-06-20 | Thailändisch | Siehe auch |
sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04 | chinesisch | 支持多种方言. Siehe auch |
Weitere Informationen zu Kaldi und QQ finden Sie unter https://k2-fsa.github.io/sherpa/social-groups.html.
Es zeigt, wie die ASR- und TTS-Python-APIs mit FastAPI verwendet werden.
Verwendet Streaming-ASR in C# mit grafischer Benutzeroberfläche.
Videodemo auf Chinesisch: 【开源】Windows实时字幕软件(网课/开会必备)
Es nutzt die JavaScript-API von sherpa-onnx zusammen mit Electron
Videodemo auf Chinesisch:爆了!炫神教你开打字挂!真正影响胜率的英雄联盟工具!英雄联盟的最后一块拼图!和游戏中的每个人无障碍沟通!