Reconnaissance vocale | Synthèse vocale |
---|---|
✔️ | ✔️ |
Identification du locuteur | Diarisation des locuteurs | Vérification du locuteur |
---|---|---|
✔️ | ✔️ | ✔️ |
Identification de la langue parlée | Marquage audio | Détection d'activité vocale |
---|---|---|
✔️ | ✔️ | ✔️ |
Repérage de mots-clés | Ajouter de la ponctuation |
---|---|
✔️ | ✔️ |
Architecture | Androïde | IOS | Fenêtres | macOS | Linux | HarmonyOS |
---|---|---|---|---|---|---|
x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
x86 | ✔️ | ✔️ | ||||
bras64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
bras32 | ✔️ | ✔️ | ✔️ | |||
riscv64 | ✔️ |
1.C++ | 2.C | 3. Python | 4. Javascript |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
5. Java | 6.C# | 7. Kotlin | 8. Rapide |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
9. Allez | 10. Fléchette | 11. Rouille | 12. Pascal |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
Pour le support Rust, veuillez consulter sherpa-rs
Il prend également en charge WebAssembly.
Ce référentiel prend en charge l'exécution des fonctions suivantes localement
sur les plateformes et systèmes d'exploitation suivants :
x86_64
, ARM 32 bits, ARM 64 bits (arm64, aarch64), RISC-V (riscv64)avec les API suivantes
C#
Description | URL |
---|---|
Diarisation des locuteurs | Cliquez-moi |
Reconnaissance vocale | Cliquez-moi |
Reconnaissance vocale avec Whisper | Cliquez-moi |
Synthèse vocale | Cliquez-moi |
Générer des sous-titres | Cliquez-moi |
Marquage audio | Cliquez-moi |
Identification de la langue parlée avec Whisper | Cliquez-moi |
Nous avons également des espaces construits à l'aide de WebAssembly. Ils sont listés ci-dessous :
Description | Espace câlin | Espace ModelScope |
---|---|---|
Détection d'activité vocale avec silero-vad | Cliquez-moi | 地址 |
Reconnaissance vocale en temps réel (chinois + anglais) avec Zipformer | Cliquez-moi | 地址 |
Reconnaissance vocale en temps réel (chinois + anglais) avec Paraformer | Cliquez-moi | 地址 |
Reconnaissance vocale en temps réel (chinois + anglais + cantonais) avec Paraformer-large | Cliquez-moi | 地址 |
Reconnaissance vocale en temps réel (anglais) | Cliquez-moi | 地址 |
VAD + reconnaissance vocale (chinois + anglais + coréen + japonais + cantonais) avec SenseVoice | Cliquez-moi | 地址 |
VAD + reconnaissance vocale (anglais) avec Whisper tiny.en | Cliquez-moi | 地址 |
VAD + reconnaissance vocale (anglais) avec Moonshine tiny | Cliquez-moi | 地址 |
VAD + reconnaissance vocale (anglais) avec Zipformer entraîné avec GigaSpeech | Cliquez-moi | 地址 |
VAD + reconnaissance vocale (chinois) avec Zipformer entraîné avec WenetSpeech | Cliquez-moi | 地址 |
VAD + reconnaissance vocale (japonais) avec Zipformer entraîné avec ReazonSpeech | Cliquez-moi | 地址 |
VAD + reconnaissance vocale (thaï) avec Zipformer entraîné avec GigaSpeech2 | Cliquez-moi | 地址 |
Reconnaissance vocale VAD + (chinois 多种方言) avec un modèle TeleSpeech-ASR CTC | Cliquez-moi | 地址 |
VAD + reconnaissance vocale (anglais + chinois, 及多种中文方言) avec Paraformer-large | Cliquez-moi | 地址 |
VAD + reconnaissance vocale (anglais + chinois, 及多种中文方言) avec Paraformer-small | Cliquez-moi | 地址 |
Synthèse vocale (anglais) | Cliquez-moi | 地址 |
Synthèse vocale (allemand) | Cliquez-moi | 地址 |
Diarisation des locuteurs | Cliquez-moi | 地址 |
Description | URL | 中国用户 |
---|---|---|
Diarisation des locuteurs | Adresse | 点此 |
Reconnaissance vocale en continu | Adresse | 点此 |
Synthèse vocale | Adresse | 点此 |
Détection d'activité vocale (VAD) | Adresse | 点此 |
VAD + reconnaissance vocale sans streaming | Adresse | 点此 |
Reconnaissance vocale en deux passes | Adresse | 点此 |
Marquage audio | Adresse | 点此 |
Marquage audio (WearOS) | Adresse | 点此 |
Identification du locuteur | Adresse | 点此 |
Identification de la langue parlée | Adresse | 点此 |
Repérage de mots-clés | Adresse | 点此 |
Description | URL | 中国用户 |
---|---|---|
Reconnaissance vocale en continu | Adresse | 点此 |
Description | URL | 中国用户 |
---|---|---|
Android (arm64-v8a, armeabi-v7a, x86_64) | Adresse | 点此 |
Linux (x64) | Adresse | 点此 |
macOS (x64) | Adresse | 点此 |
macOS (arm64) | Adresse | 点此 |
Windows (x64) | Adresse | 点此 |
Remarque : Vous devez créer à partir des sources pour iOS.
Description | URL | 中国用户 |
---|---|---|
Générer des sous-titres (生成字幕) | Adresse | 点此 |
Description | URL |
---|---|
Reconnaissance vocale (parole en texte, ASR) | Adresse |
Synthèse vocale (TTS) | Adresse |
VAD | Adresse |
Repérage de mots-clés | Adresse |
Marquage audio | Adresse |
Identification du haut-parleur (Speaker ID) | Adresse |
Identification de la langue parlée (Language ID) | Voir les modèles Whisper ASR multilingues de la reconnaissance vocale |
Ponctuation | Adresse |
Segmentation des locuteurs | Adresse |
S'il vous plaît voir
pour plus de modèles. Le tableau suivant n’en répertorie que CERTAINS .
Nom | Langues prises en charge | Description |
---|---|---|
sherpa-onnx-streaming-zipformer-bilingue-zh-fr-2023-02-20 | chinois, anglais | Voir aussi |
sherpa-onnx-streaming-zipformer-small-bilingue-zh-fr-2023-02-16 | chinois, anglais | Voir aussi |
sherpa-onnx-streaming-zipformer-zh-14M-2023-02-23 | Chinois | Convient au processeur Cortex A7. Voir aussi |
sherpa-onnx-streaming-zipformer-fr-20M-2023-02-17 | Anglais | Convient au processeur Cortex A7. Voir aussi |
sherpa-onnx-streaming-zipformer-coréen-2024-06-16 | coréen | Voir aussi |
sherpa-onnx-streaming-zipformer-fr-2023-04-14 | Français | Voir aussi |
S'il vous plaît voir
pour plus de modèles. Le tableau suivant n’en répertorie que CERTAINS .
Nom | Langues prises en charge | Description |
---|---|---|
Whisper tiny.fr | Anglais | Voir aussi |
Moonshine minuscule | Anglais | Voir aussi |
sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17 | Chinois, cantonais, anglais, coréen, japonais | Il s'agit d'une question. Voir aussi |
sherpa-onnx-paraformer-zh-2024-03-09 | chinois, anglais | Il s'agit d'une question. Voir aussi |
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | japonais | Voir aussi |
sherpa-onnx-nemo-transducteur-giga-am-russe-2024-10-24 | russe | Voir aussi |
sherpa-onnx-nemo-ctc-giga-am-russe-2024-10-24 | russe | Voir aussi |
sherpa-onnx-zipformer-ru-2024-09-18 | russe | Voir aussi |
sherpa-onnx-zipformer-coréen-2024-06-24 | coréen | Voir aussi |
sherpa-onnx-zipformer-thai-2024-06-20 | thaïlandais | Voir aussi |
sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04 | Chinois | Il s'agit d'une question. Voir aussi |
Veuillez consulter https://k2-fsa.github.io/sherpa/social-groups.html pour les versions Kaldi et QQ .
Il montre comment utiliser les API Python ASR et TTS avec FastAPI.
Utilise le streaming ASR en C# avec une interface utilisateur graphique.
Démo vidéo en chinois : 【开源】Windows实时字幕软件(网课/开会必备)
Il utilise l'API JavaScript de sherpa-onnx avec Electron
Démo vidéo en chinois :爆了!炫神教你开打字挂!真正影响胜率的英雄联盟工具!英雄联盟的最后一块拼图!和游戏中的每个人无障碍沟通!