Pengenalan ucapan | Sintesis ucapan |
---|---|
✔️ | ✔️ |
Identifikasi pembicara | Diarisasi pembicara | Verifikasi pembicara |
---|---|---|
✔️ | ✔️ | ✔️ |
Identifikasi Bahasa Lisan | Penandaan audio | Deteksi aktivitas suara |
---|---|---|
✔️ | ✔️ | ✔️ |
Pencarian kata kunci | Tambahkan tanda baca |
---|---|
✔️ | ✔️ |
Arsitektur | Android | iOS | jendela | macOS | linux | HarmoniOS |
---|---|---|---|---|---|---|
x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
x86 | ✔️ | ✔️ | ||||
lengan64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
lengan32 | ✔️ | ✔️ | ✔️ | |||
risikocv64 | ✔️ |
1.C++ | 2.C | 3. ular piton | 4.JavaScript |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
5. Jawa | 6.C# | 7.Kotlin | 8. Cepat |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
9. Pergi | 10. Anak panah | 11. Karat | 12. Pascal |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
Untuk dukungan Rust, silakan lihat sherpa-rs
Ini juga mendukung WebAssembly.
Repositori ini mendukung menjalankan fungsi-fungsi berikut secara lokal
pada platform dan sistem operasi berikut:
x86_64
, ARM 32-bit, ARM 64-bit (arm64, aarch64), RISC-V (riscv64)dengan API berikut
C#
Keterangan | URL |
---|---|
Diarisasi pembicara | Klik saya |
Pengenalan ucapan | Klik saya |
Pengenalan ucapan dengan Whisper | Klik saya |
Sintesis ucapan | Klik saya |
Hasilkan subtitle | Klik saya |
Penandaan audio | Klik saya |
Identifikasi bahasa lisan dengan Whisper | Klik saya |
Kami juga memiliki ruang yang dibangun menggunakan WebAssembly. Mereka tercantum di bawah ini:
Keterangan | Ruang berpelukan | Ruang ModelScope |
---|---|---|
Deteksi aktivitas suara dengan silero-vad | Klik saya | 地址 |
Pengenalan ucapan waktu nyata (Bahasa Mandarin + Inggris) dengan Zipformer | Klik saya | 地址 |
Pengenalan ucapan waktu nyata (Bahasa Mandarin + Inggris) dengan Paraformer | Klik saya | 地址 |
Pengenalan ucapan waktu nyata (Cina + Inggris + Kanton) dengan Paraformer-besar | Klik saya | 地址 |
Pengenalan ucapan real-time (Bahasa Inggris) | Klik saya | 地址 |
VAD + pengenalan ucapan (Cina + Inggris + Korea + Jepang + Kanton) dengan SenseVoice | Klik saya | 地址 |
VAD + pengenalan suara (Bahasa Inggris) dengan Whisper tiny.en | Klik saya | 地址 |
VAD + pengenalan suara (Bahasa Inggris) dengan Moonshine kecil | Klik saya | 地址 |
VAD + pengenalan suara (Bahasa Inggris) dengan Zipformer dilatih dengan GigaSpeech | Klik saya | 地址 |
VAD + pengenalan suara (Cina) dengan Zipformer dilatih dengan WenetSpeech | Klik saya | 地址 |
VAD + pengenalan suara (Jepang) dengan Zipformer dilatih dengan ReazonSpeech | Klik saya | 地址 |
VAD + pengenalan suara (Thailand) dengan Zipformer dilatih dengan GigaSpeech2 | Klik saya | 地址 |
VAD + pengenalan suara (Cina 多种方言) dengan model TeleSpeech-ASR CTC | Klik saya | 地址 |
VAD + pengenalan ucapan (Bahasa Inggris + Mandarin, 及多种中文方言) dengan Paraformer-large | Klik saya | 地址 |
VAD + pengenalan suara (Bahasa Inggris + Mandarin, 及多种中文方言) dengan Paraformer-small | Klik saya | 地址 |
Sintesis ucapan (Bahasa Inggris) | Klik saya | 地址 |
Sintesis ucapan (Jerman) | Klik saya | 地址 |
Diarisasi pembicara | Klik saya | 地址 |
Keterangan | URL | 中国用户 |
---|---|---|
Diarisasi pembicara | Alamat | 点此 |
Pengenalan ucapan streaming | Alamat | 点此 |
Teks-ke-ucapan | Alamat | 点此 |
Deteksi aktivitas suara (VAD) | Alamat | 点此 |
VAD + pengenalan ucapan non-streaming | Alamat | 点此 |
Pengenalan ucapan dua arah | Alamat | 点此 |
Penandaan audio | Alamat | 点此 |
Penandaan audio (WearOS) | Alamat | 点此 |
Identifikasi pembicara | Alamat | 点此 |
Identifikasi bahasa lisan | Alamat | 点此 |
Pencarian kata kunci | Alamat | 点此 |
Keterangan | URL | 中国用户 |
---|---|---|
Pengenalan ucapan streaming | Alamat | 点此 |
Keterangan | URL | 中国用户 |
---|---|---|
Android (arm64-v8a, armeabi-v7a, x86_64) | Alamat | 点此 |
Linux (x64) | Alamat | 点此 |
macOS (x64) | Alamat | 点此 |
macOS (arm64) | Alamat | 点此 |
jendela (x64) | Alamat | 点此 |
Catatan: Anda perlu membangun dari sumber untuk iOS.
Keterangan | URL | 中国用户 |
---|---|---|
Menghasilkan subtitle (生成字幕) | Alamat | 点此 |
Keterangan | URL |
---|---|
Pengenalan ucapan (ucapan ke teks, ASR) | Alamat |
Teks-ke-ucapan (TTS) | Alamat |
VAD | Alamat |
Pencarian kata kunci | Alamat |
Penandaan audio | Alamat |
Identifikasi pembicara (ID Pembicara) | Alamat |
Identifikasi bahasa lisan (ID Bahasa) | Lihat model Whisper ASR multibahasa dari Pengenalan ucapan |
tanda baca | Alamat |
Segmentasi pembicara | Alamat |
Silakan lihat
untuk lebih banyak model. Tabel berikut hanya mencantumkan BEBERAPA di antaranya.
Nama | Bahasa yang Didukung | Keterangan |
---|---|---|
sherpa-onnx-streaming-zipformer-bilingual-zh-id-20-02-2023 | Cina, Inggris | Lihat juga |
sherpa-onnx-streaming-zipformer-kecil-bilingual-zh-id-2023-02-16 | Cina, Inggris | Lihat juga |
sherpa-onnx-streaming-zipformer-zh-14M-23-02-2023 | Cina | Cocok untuk CPU Cortex A7. Lihat juga |
sherpa-onnx-streaming-zipformer-id-20M-2023-02-17 | Bahasa inggris | Cocok untuk CPU Cortex A7. Lihat juga |
sherpa-onnx-streaming-zipformer-korean-2024-06-16 | Korea | Lihat juga |
sherpa-onnx-streaming-zipformer-fr-2023-04-14 | Perancis | Lihat juga |
Silakan lihat
untuk lebih banyak model. Tabel berikut hanya mencantumkan BEBERAPA di antaranya.
Nama | Bahasa yang Didukung | Keterangan |
---|---|---|
Bisikan kecil.en | Bahasa inggris | Lihat juga |
Moonshine kecil | Bahasa inggris | Lihat juga |
sherpa-onnx-sense-voice-zh-en-ja-ko-yue-17-07-2024 | Cina, Kanton, Inggris, Korea, Jepang | 支持多种中文方言. Lihat juga |
sherpa-onnx-paraformer-zh-2024-03-09 | Cina, Inggris | 也支持多种中文方言. Lihat juga |
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | Jepang | Lihat juga |
sherpa-onnx-nemo-transduser-giga-am-russian-24-10-2024 | Rusia | Lihat juga |
sherpa-onnx-nemo-ctc-giga-am-russian-24-10-2024 | Rusia | Lihat juga |
sherpa-onnx-zipformer-ru-2024-09-18 | Rusia | Lihat juga |
sherpa-onnx-zipformer-korean-2024-06-24 | Korea | Lihat juga |
sherpa-onnx-zipformer-thai-2024-06-20 | Thai | Lihat juga |
sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04 | Cina | 支持多种方言. Lihat juga |
Silakan lihat https://k2-fsa.github.io/sherpa/social-groups.html untuk 新一代 Kaldi微信交流群dan QQ 交流群.
Ini menunjukkan cara menggunakan ASR dan TTS Python API dengan FastAPI.
Menggunakan streaming ASR di C# dengan antarmuka pengguna grafis.
Demo video dalam bahasa Mandarin: 【开源】Windows实时字幕软件(网课/开会必备)
Ia menggunakan API JavaScript sherpa-onnx bersama dengan Electron
Demo video dalam bahasa Mandarin:爆了!炫神教你开打字挂 Narkoba!英雄联盟的最后一块拼图!和游戏中的每个人无障碍沟通!