sherpa onnx Download - sherpa onnx -Quellcode-Download

sherpa onnx

C/C++

v1.10.34

Herunterladen

Unterstützte Funktionen

Spracherkennung	Sprachsynthese
✔️	✔️

Identifizierung des Sprechers	Sprechertagebuch	Überprüfung des Sprechers
✔️	✔️	✔️

Identifizierung der gesprochenen Sprache	Audio-Tagging	Erkennung von Sprachaktivitäten
✔️	✔️	✔️

Keyword-Spotting	Satzzeichen hinzufügen
✔️	✔️

Unterstützte Plattformen

Architektur	Android	iOS	Windows	macOS	Linux	HarmonyOS
x64	✔️		✔️	✔️	✔️	✔️
x86	✔️		✔️
arm64	✔️	✔️	✔️	✔️	✔️	✔️
arm32	✔️				✔️	✔️
riscv64					✔️

Unterstützte Programmiersprachen

1. C++	2. C	3. Python	4. JavaScript
✔️	✔️	✔️	✔️

5. Java	6. C#	7. Kotlin	8. Schnell
✔️	✔️	✔️	✔️

9. Geh	10. Dart	11. Rost	12. Pascal
✔️	✔️	✔️	✔️

Informationen zur Rust-Unterstützung finden Sie unter sherpa-rs

Es unterstützt auch WebAssembly.

Einführung

Dieses Repository unterstützt die lokale Ausführung der folgenden Funktionen

Speech-to-Text (d. h. ASR); Sowohl Streaming als auch Nicht-Streaming werden unterstützt
Text-to-Speech (d. h. TTS)
Sprechertagebuch
Identifizierung des Sprechers
Überprüfung des Sprechers
Identifizierung der gesprochenen Sprache
Audio-Tagging
VAD (z. B. silero-vad)
Keyword-Spotting

auf folgenden Plattformen und Betriebssystemen:

x86, x86_64 , 32-Bit-ARM, 64-Bit-ARM (arm64, aarch64), RISC-V (riscv64)
Linux, macOS, Windows, openKylin
Android, WearOS
iOS
HarmonyOS
NodeJS
WebAssembly
Raspberry Pi
RV1126
LicheePi4A
VisionFive 2
旭日X3派
爱芯派
usw

mit den folgenden APIs

C++, C, Python, Go, C#
Java, Kotlin, JavaScript
Swift, Rust
Dart, Object Pascal

Links für Huggingface Spaces

Sie können die folgenden Huggingface-Bereiche besuchen, um Sherpa-onnx auszuprobieren, ohne etwas zu installieren. Sie benötigen lediglich einen Browser.

Beschreibung	URL
Sprechertagebuch	Klicken Sie auf mich
Spracherkennung	Klicken Sie auf mich
Spracherkennung mit Whisper	Klicken Sie auf mich
Sprachsynthese	Klicken Sie auf mich
Untertitel generieren	Klicken Sie auf mich
Audio-Tagging	Klicken Sie auf mich
Identifizierung der gesprochenen Sprache mit Whisper	Klicken Sie auf mich

Wir haben auch Räume, die mit WebAssembly erstellt wurden. Sie sind unten aufgeführt:

Beschreibung	Umarmender Gesichtsraum	ModelScope-Bereich
Sprachaktivitätserkennung mit Silero-Vad	Klicken Sie auf mich	地址
Echtzeit-Spracherkennung (Chinesisch + Englisch) mit Zipformer	Klicken Sie auf mich	地址
Echtzeit-Spracherkennung (Chinesisch + Englisch) mit Paraformer	Klicken Sie auf mich	地址
Echtzeit-Spracherkennung (Chinesisch + Englisch + Kantonesisch) mit Paraformer-large	Klicken Sie auf mich	地址
Echtzeit-Spracherkennung (Englisch)	Klicken Sie auf mich	地址
VAD + Spracherkennung (Chinesisch + Englisch + Koreanisch + Japanisch + Kantonesisch) mit SenseVoice	Klicken Sie auf mich	地址
VAD + Spracherkennung (Englisch) mit Whisper tiny.en	Klicken Sie auf mich	地址
VAD + Spracherkennung (Englisch) mit Moonshine tiny	Klicken Sie auf mich	地址
VAD + Spracherkennung (Englisch) mit Zipformer, trainiert mit GigaSpeech	Klicken Sie auf mich	地址
VAD + Spracherkennung (Chinesisch) mit Zipformer, trainiert mit WenetSpeech	Klicken Sie auf mich	地址
VAD + Spracherkennung (Japanisch) mit Zipformer, trainiert mit ReazonSpeech	Klicken Sie auf mich	地址
VAD + Spracherkennung (Thai) mit Zipformer, trainiert mit GigaSpeech2	Klicken Sie auf mich	地址
VAD + Spracherkennung (Chinesisch 多种方言) mit einem TeleSpeech-ASR CTC-Modell	Klicken Sie auf mich	地址
VAD + Spracherkennung (Englisch + Chinesisch, 及多种中文方言) mit Paraformer-large	Klicken Sie auf mich	地址
VAD + Spracherkennung (Englisch + Chinesisch, 及多种中文方言) mit Paraformer-small	Klicken Sie auf mich	地址
Sprachsynthese (Englisch)	Klicken Sie auf mich	地址
Sprachsynthese (Deutsch)	Klicken Sie auf mich	地址
Sprechertagebuch	Klicken Sie auf mich	地址

Links für vorgefertigte Android-APKs

In der folgenden Tabelle finden Sie vorgefertigte Android-APKs für dieses Repository

Beschreibung	URL	中国用户
Sprechertagebuch	Adresse	点此
Streaming-Spracherkennung	Adresse	点此
Text-zu-Sprache	Adresse	点此
Sprachaktivitätserkennung (VAD)	Adresse	点此
VAD + Nicht-Streaming-Spracherkennung	Adresse	点此
Spracherkennung in zwei Durchgängen	Adresse	点此
Audio-Tagging	Adresse	点此
Audio-Tagging (WearOS)	Adresse	点此
Identifizierung des Sprechers	Adresse	点此
Identifizierung der gesprochenen Sprache	Adresse	点此
Keyword-Spotting	Adresse	点此

Links für vorgefertigte Flutter-APPs

Spracherkennung in Echtzeit

Beschreibung	URL	中国用户
Streaming-Spracherkennung	Adresse	点此

Text-zu-Sprache

Beschreibung	URL	中国用户
Android (arm64-v8a, armeabi-v7a, x86_64)	Adresse	点此
Linux (x64)	Adresse	点此
macOS (x64)	Adresse	点此
macOS (arm64)	Adresse	点此
Windows (x64)	Adresse	点此

Hinweis: Sie müssen für iOS aus dem Quellcode erstellen.

Links für vorgefertigte Lazarus-APPs

Untertitel generieren

Beschreibung	URL	中国用户
Untertitel generieren (生成字幕)	Adresse	点此

Links für vorab trainierte Modelle

Beschreibung	URL
Spracherkennung (speech to text, ASR)	Adresse
Text-to-Speech (TTS)	Adresse
VAD	Adresse
Keyword-Spotting	Adresse
Audio-Tagging	Adresse
Sprecheridentifikation (Sprecher-ID)	Adresse
Identifizierung der gesprochenen Sprache (Sprach-ID)	Sehen Sie sich mehrsprachige Whisper ASR-Modelle aus der Spracherkennung an
Interpunktion	Adresse
Sprechersegmentierung	Adresse

Einige vorab trainierte ASR-Modelle (Streaming)

Bitte sehen

https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-transducer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-paraformer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/online-ctc/index.html

für weitere Modelle. In der folgenden Tabelle sind nur EINIGE davon aufgeführt.

Name	Unterstützte Sprachen	Beschreibung
sherpa-onnx-streaming-zipformer-bilingual-zh-en-2023-02-20	Chinesisch, Englisch	Siehe auch
sherpa-onnx-streaming-zipformer-small-bilingual-zh-en-2023-02-16	Chinesisch, Englisch	Siehe auch
sherpa-onnx-streaming-zipformer-zh-14M-2023-02-23	chinesisch	Geeignet für Cortex A7-CPU. Siehe auch
sherpa-onnx-streaming-zipformer-en-20M-2023-02-17	Englisch	Geeignet für Cortex A7-CPU. Siehe auch
Sherpa-onnx-streaming-zipformer-koreanisch-2024-06-16	Koreanisch	Siehe auch
Sherpa-onnx-streaming-zipformer-fr-2023-04-14	Französisch	Siehe auch

Einige vorab trainierte ASR-Modelle (Nicht-Streaming)

Bitte sehen

https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-transducer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-paraformer/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-ctc/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/telespeech/index.html
https://k2-fsa.github.io/sherpa/onnx/pretrained_models/whisper/index.html

für weitere Modelle. In der folgenden Tabelle sind nur EINIGE davon aufgeführt.

Name	Unterstützte Sprachen	Beschreibung
Whisper tiny.en	Englisch	Siehe auch
Mondschein winzig	Englisch	Siehe auch
sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17	Chinesisch, Kantonesisch, Englisch, Koreanisch, Japanisch	支持多种中文方言. Siehe auch
sherpa-onnx-paraformer-zh-2024-03-09	Chinesisch, Englisch	也支持多种中文方言. Siehe auch
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01	japanisch	Siehe auch
Sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24	Russisch	Siehe auch
Sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24	Russisch	Siehe auch
sherpa-onnx-zipformer-ru-2024-09-18	Russisch	Siehe auch
Sherpa-onnx-zipformer-koreanisch-2024-06-24	Koreanisch	Siehe auch
sherpa-onnx-zipformer-thai-2024-06-20	Thailändisch	Siehe auch
sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04	chinesisch	支持多种方言. Siehe auch