Reconhecimento de fala | Síntese de fala |
---|---|
✔️ | ✔️ |
Identificação do alto-falante | Diarização de alto-falante | Verificação de alto-falante |
---|---|---|
✔️ | ✔️ | ✔️ |
Identificação da língua falada | Marcação de áudio | Detecção de atividade de voz |
---|---|---|
✔️ | ✔️ | ✔️ |
Localização de palavras-chave | Adicionar pontuação |
---|---|
✔️ | ✔️ |
Arquitetura | Android | iOS | Windows | macOS | linux | Harmony OS |
---|---|---|---|---|---|---|
x64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | |
x86 | ✔️ | ✔️ | ||||
braço64 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
braço32 | ✔️ | ✔️ | ✔️ | |||
riscv64 | ✔️ |
1. C++ | 2.C | 3. Pitão | 4.JavaScript |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
5.Java | 6. C# | 7. Kotlin | 8. Rápido |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
9. Vá | 10. Dardo | 11. Ferrugem | 12. Pascal |
---|---|---|---|
✔️ | ✔️ | ✔️ | ✔️ |
Para suporte ao Rust, consulte sherpa-rs
Ele também suporta WebAssembly.
Este repositório suporta a execução local das seguintes funções
nas seguintes plataformas e sistemas operacionais:
x86_64
, ARM de 32 bits, ARM de 64 bits (arm64, aarch64), RISC-V (riscv64)com as seguintes APIs
C#
Descrição | URL |
---|---|
Diarização de alto-falante | Clique em mim |
Reconhecimento de fala | Clique em mim |
Reconhecimento de fala com Whisper | Clique em mim |
Síntese de fala | Clique em mim |
Gerar legendas | Clique em mim |
Marcação de áudio | Clique em mim |
Identificação da linguagem falada com Whisper | Clique em mim |
Também temos espaços construídos em WebAssembly. Eles estão listados abaixo:
Descrição | Abraçando o espaço | Espaço ModelScope |
---|---|---|
Detecção de atividade de voz com silero-vad | Clique em mim | 地址 |
Reconhecimento de fala em tempo real (chinês + inglês) com Zipformer | Clique em mim | 地址 |
Reconhecimento de fala em tempo real (chinês + inglês) com Paraformer | Clique em mim | 地址 |
Reconhecimento de fala em tempo real (chinês + inglês + cantonês) com Paraformer-large | Clique em mim | 地址 |
Reconhecimento de fala em tempo real (inglês) | Clique em mim | 地址 |
VAD + reconhecimento de fala (chinês + inglês + coreano + japonês + cantonês) com SenseVoice | Clique em mim | 地址 |
VAD + reconhecimento de fala (inglês) com Whisper tiny.en | Clique em mim | 地址 |
VAD + reconhecimento de fala (Inglês) com Moonshine tiny | Clique em mim | 地址 |
VAD + reconhecimento de fala (Inglês) com Zipformer treinado com GigaSpeech | Clique em mim | 地址 |
VAD + reconhecimento de fala (chinês) com Zipformer treinado com WenetSpeech | Clique em mim | 地址 |
VAD + reconhecimento de fala (japonês) com Zipformer treinado com ReazonSpeech | Clique em mim | 地址 |
VAD + reconhecimento de fala (tailandês) com Zipformer treinado com GigaSpeech2 | Clique em mim | 地址 |
VAD + reconhecimento de fala (chinês 多种方言) com modelo TeleSpeech-ASR CTC | Clique em mim | 地址 |
VAD + reconhecimento de fala (Inglês + Chinês, 及多种中文方言) com Paraformer-grande | Clique em mim | 地址 |
VAD + reconhecimento de fala (Inglês + Chinês, 及多种中文方言) com Paraformer-small | Clique em mim | 地址 |
Síntese de fala (Inglês) | Clique em mim | 地址 |
Síntese de fala (alemão) | Clique em mim | 地址 |
Diarização de alto-falante | Clique em mim | 地址 |
Descrição | URL | 中国用户 |
---|---|---|
Diarização de alto-falante | Endereço | 点此 |
Streaming de reconhecimento de fala | Endereço | 点此 |
Conversão de texto para fala | Endereço | 点此 |
Detecção de atividade de voz (VAD) | Endereço | 点此 |
VAD + reconhecimento de fala sem streaming | Endereço | 点此 |
Reconhecimento de fala em duas passagens | Endereço | 点此 |
Marcação de áudio | Endereço | 点此 |
Marcação de áudio (WearOS) | Endereço | 点此 |
Identificação do alto-falante | Endereço | 点此 |
Identificação da língua falada | Endereço | 点此 |
Localização de palavras-chave | Endereço | 点此 |
Descrição | URL | 中国用户 |
---|---|---|
Streaming de reconhecimento de fala | Endereço | 点此 |
Descrição | URL | 中国用户 |
---|---|---|
Android (arm64-v8a, armeabi-v7a, x86_64) | Endereço | 点此 |
Linux (x64) | Endereço | 点此 |
macOS (x64) | Endereço | 点此 |
macOS (arm64) | Endereço | 点此 |
Janelas (x64) | Endereço | 点此 |
Nota: você precisa compilar a partir do código-fonte para iOS.
Descrição | URL | 中国用户 |
---|---|---|
Gerar legendas (生成字幕) | Endereço | 点此 |
Descrição | URL |
---|---|
Reconhecimento de fala (fala para texto, ASR) | Endereço |
Conversão de texto para fala (TTS) | Endereço |
DVA | Endereço |
Localização de palavras-chave | Endereço |
Marcação de áudio | Endereço |
Identificação do alto-falante (ID do alto-falante) | Endereço |
Identificação do idioma falado (ID do idioma) | Veja modelos Whisper ASR multilíngues do reconhecimento de fala |
Pontuação | Endereço |
Segmentação de alto-falantes | Endereço |
Por favor veja
para mais modelos. A tabela a seguir lista apenas ALGUNS deles.
Nome | Idiomas Suportados | Descrição |
---|---|---|
sherpa-onnx-streaming-zipformer-bilíngue-zh-pt-2023-02-20 | Chinês, Inglês | Veja também |
sherpa-onnx-streaming-zipformer-small-bilíngue-zh-pt-2023-02-16 | Chinês, Inglês | Veja também |
sherpa-onnx-streaming-zipformer-zh-14M-2023-02-23 | chinês | Adequado para CPU Cortex A7. Veja também |
sherpa-onnx-streaming-zipformer-pt-20M-2023-02-17 | Inglês | Adequado para CPU Cortex A7. Veja também |
sherpa-onnx-streaming-zipformer-coreano-2024-06-16 | coreano | Veja também |
sherpa-onnx-streaming-zipformer-fr-2023-04-14 | Francês | Veja também |
Por favor veja
para mais modelos. A tabela a seguir lista apenas ALGUNS deles.
Nome | Idiomas Suportados | Descrição |
---|---|---|
Whisper tiny.en | Inglês | Veja também |
Luar minúsculo | Inglês | Veja também |
sherpa-onnx-sense-voz-zh-en-ja-ko-yue-2024-07-17 | Chinês, cantonês, inglês, coreano, japonês | 支持多种中文方言. Veja também |
sherpa-onnx-paraformer-zh-2024-03-09 | Chinês, Inglês | 也支持多种中文方言. Veja também |
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | japonês | Veja também |
sherpa-onnx-nemo-transdutor-giga-am-russo-2024-10-24 | russo | Veja também |
sherpa-onnx-nemo-ctc-giga-am-russo-2024-10-24 | russo | Veja também |
sherpa-onnx-zipformer-ru-2024-09-18 | russo | Veja também |
sherpa-onnx-zipformer-coreano-2024-06-24 | coreano | Veja também |
sherpa-onnx-zipformer-thai-2024-06-20 | Tailandês | Veja também |
sherpa-onnx-telespeech-ctc-int8-zh-2024-06-04 | chinês | 支持多种方言. Veja também |
Consulte https://k2-fsa.github.io/sherpa/social-groups.html para 新一代 Kaldi微信交流群e QQ 交流群.
Ele mostra como usar as APIs Python ASR e TTS com FastAPI.
Usa streaming ASR em C# com interface gráfica do usuário.
Vídeo de demonstração em chinês: 【开源】Windows实时字幕软件(网课/开会必备)
Ele usa a API JavaScript do sherpa-onnx junto com o Electron
Demonstração em vídeo em chinês:爆了!!!英雄联盟的最后一块拼图!和游戏中的每个人无障碍沟通!