sherpa onnx
v1.10.34
음성 인식 | 음성 합성 |
---|---|
✔️ | ✔️ |
화자 식별 | 화자 분할 | 화자 확인 |
---|---|---|
✔️ | ✔️ | ✔️ |
음성 언어 식별 | 오디오 태깅 | 음성 활동 감지 |
---|---|---|
✔️ | ✔️ | ✔️ |
키워드 발견 | 구두점 추가 |
---|---|
✔️ | ✔️ |
건축학 | 기계적 인조 인간 | iOS | 윈도우 | macOS | 리눅스 | 하모니 OS |
---|---|---|---|---|---|---|
x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
x86 | ✔️ | ✔️ | ||||
arm64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
arm32 | ✔️ | ✔️ | ✔️ | |||
riscv64 | ✔️ |
1.C++ | 2. 다 | 3. 파이썬 | 4. 자바스크립트 |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
5. 자바 | 6.C# | 7. 코틀린 | 8. 스위프트 |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
9. 가다 | 10. 다트 | 11. 러스트 | 12. 파스칼 |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
Rust 지원에 대해서는 sherpa-rs를 참조하세요.
웹어셈블리도 지원합니다.
이 저장소는 다음 기능을 로컬에서 실행하는 것을 지원합니다.
다음 플랫폼 및 운영 체제에서:
x86_64
, 32비트 ARM, 64비트 ARM(arm64, aarch64), RISC-V(riscv64)다음 API를 사용하여
C#
설명 | URL |
---|---|
화자 분할 | 나를 클릭하세요 |
음성 인식 | 나를 클릭하세요 |
Whisper를 이용한 음성 인식 | 나를 클릭하세요 |
음성 합성 | 나를 클릭하세요 |
자막 생성 | 나를 클릭하세요 |
오디오 태깅 | 나를 클릭하세요 |
Whisper를 통한 음성 언어 식별 | 나를 클릭하세요 |
WebAssembly를 사용하여 구축한 공간도 있습니다. 아래에 나열되어 있습니다:
설명 | 허깅페이스 공간 | ModelScope 공간 |
---|---|---|
silero-vad를 사용한 음성 활동 감지 | 나를 클릭하세요 | 地址 |
Zipformer를 이용한 실시간 음성인식(중국어+영어) | 나를 클릭하세요 | 地址 |
Paraformer를 이용한 실시간 음성인식(중국어+영어) | 나를 클릭하세요 | 地址 |
Paraformer-large를 통한 실시간 음성인식(중국어+영어+광둥어) | 나를 클릭하세요 | 地址 |
실시간 음성인식(영어) | 나를 클릭하세요 | 地址 |
SenseVoice를 통한 VAD + 음성 인식(중국어 + 영어 + 한국어 + 일본어 + 광둥어) | 나를 클릭하세요 | 地址 |
VAD + 음성 인식(영어) Whispertiny.en 포함 | 나를 클릭하세요 | 地址 |
Moonshine Tiny를 사용한 VAD + 음성 인식(영어) | 나를 클릭하세요 | 地址 |
GigaSpeech로 훈련된 Zipformer를 사용한 VAD + 음성 인식(영어) | 나를 클릭하세요 | 地址 |
WenetSpeech로 훈련된 Zipformer를 사용한 VAD + 음성 인식(중국어) | 나를 클릭하세요 | 地址 |
ReazonSpeech로 훈련된 Zipformer를 사용한 VAD + 음성 인식(일본어) | 나를 클릭하세요 | 地址 |
GigaSpeech2로 훈련된 Zipformer를 사용한 VAD + 음성 인식(태국어) | 나를 클릭하세요 | 地址 |
TeleSpeech-ASR CTC 모델을 사용한 VAD + 음성 인식(중국어 多种方言) | 나를 클릭하세요 | 地址 |
VAD + 음성인식(영어+중국어, 及多种中文方言) with Paraformer-large | 나를 클릭하세요 | 地址 |
VAD + 음성인식(영어+중국어, 及多种中文方言) with Paraformer-small | 나를 클릭하세요 | 地址 |
음성합성(영어) | 나를 클릭하세요 | 地址 |
음성 합성(독일어) | 나를 클릭하세요 | 地址 |
화자 분할 | 나를 클릭하세요 | 地址 |
설명 | URL | 중국용户 |
---|---|---|
화자 분할 | 주소 | 点此 |
스트리밍 음성 인식 | 주소 | 点此 |
텍스트 음성 변환 | 주소 | 点此 |
음성 활동 감지(VAD) | 주소 | 点此 |
VAD + 비스트리밍 음성 인식 | 주소 | 点此 |
2단계 음성 인식 | 주소 | 点此 |
오디오 태깅 | 주소 | 点此 |
오디오 태깅(WearOS) | 주소 | 点此 |
화자 식별 | 주소 | 点此 |
음성 언어 식별 | 주소 | 点此 |
키워드 발견 | 주소 | 点此 |
설명 | URL | 중국용户 |
---|---|---|
스트리밍 음성 인식 | 주소 | 点此 |
설명 | URL | 중국용户 |
---|---|---|
안드로이드(arm64-v8a, armeabi-v7a, x86_64) | 주소 | 点此 |
리눅스(x64) | 주소 | 点此 |
맥OS(x64) | 주소 | 点此 |
맥OS(arm64) | 주소 | 点此 |
윈도우(x64) | 주소 | 点此 |
참고: iOS용 소스에서 빌드해야 합니다.
설명 | URL | 중국용户 |
---|---|---|
자막 생성(生成字幕) | 주소 | 点此 |
설명 | URL |
---|---|
음성 인식(음성을 텍스트로, ASR) | 주소 |
텍스트 음성 변환(TTS) | 주소 |
VAD | 주소 |
키워드 발견 | 주소 |
오디오 태깅 | 주소 |
화자 식별(화자 ID) | 주소 |
음성 언어 식별(언어 ID) | 음성 인식에서 다국어 Whisper ASR 모델 보기 |
구두 | 주소 |
스피커 세분화 | 주소 |
참조하십시오
더 많은 모델을 보려면. 다음 표에는 그 중 일부만 나열되어 있습니다.
이름 | 지원되는 언어 | 설명 |
---|---|---|
sherpa-onnx-스트리밍-zipformer-이중 언어-zh-en-2023-02-20 | 중국어, 영어 | 또한보십시오 |
sherpa-onnx-스트리밍-zipformer-소형-이중 언어-zh-en-2023-02-16 | 중국어, 영어 | 또한보십시오 |
셰르파-onnx-스트리밍-zipformer-zh-14M-2023-02-23 | 중국인 | Cortex A7 CPU에 적합합니다. 또한보십시오 |
sherpa-onnx-스트리밍-zipformer-en-20M-2023-02-17 | 영어 | Cortex A7 CPU에 적합합니다. 또한보십시오 |
셰르파-onnx-스트리밍-zipformer-한국어-2024-06-16 | 한국인 | 또한보십시오 |
셰르파-onnx-스트리밍-zipformer-fr-2023-04-14 | 프랑스 국민 | 또한보십시오 |
참조하십시오
더 많은 모델을 보려면. 다음 표에는 그 중 일부만 나열되어 있습니다.
이름 | 지원되는 언어 | 설명 |
---|---|---|
속삭여줘tiny.en | 영어 | 또한보십시오 |
작은 달빛 | 영어 | 또한보십시오 |
셰르파-onnx-센스-음성-zh-en-ja-ko-yue-2024-07-17 | 중국어, 광둥어, 영어, 한국어, 일본어 | 支持多种中文方言. 또한보십시오 |
셰르파-onnx-paraformer-zh-2024-03-09 | 중국어, 영어 | 也支持多种中文方言. 또한보십시오 |
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | 일본어 | 또한보십시오 |
sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24 | 러시아인 | 또한보십시오 |
sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24 | 러시아인 | 또한보십시오 |
셰르파-onnx-zipformer-ru-2024-09-18 | 러시아인 | 또한보십시오 |
sherpa-onnx-zipformer-한국어-2024-06-24 | 한국인 | 또한보십시오 |
셰르파-onnx-zipformer-태국-2024-06-20 | 태국어 | 또한보십시오 |
셰르파-onnx-텔레스피치-ctc-int8-zh-2024-06-04 | 중국인 | 더 많은 방법을 선택하세요. 또한보십시오 |
新一代 Kaldi微信交流群및 QQ 交流群에 대해서는 https://k2-fsa.github.io/sherpa/social-groups.html을 참조하세요.
FastAPI와 함께 ASR 및 TTS Python API를 사용하는 방법을 보여줍니다.
그래픽 사용자 인터페이스를 통해 C#에서 스트리밍 ASR을 사용합니다.
중국어로 된 비디오 데모: 【开源】Windows实时字幕软件(网课/开会必备)
Electron과 함께 sherpa-onnx의 JavaScript API를 사용합니다.
중국어로 된 비디오 데모: 정말 멋지네요!英雄联盟的最后一块拼图!