sherpa
ist ein Open-Source-Sprach-Text-Text-Inferenz-Framework, das PyTorch verwendet und sich ausschließlich auf End-to-End-Modelle (E2E) konzentriert, nämlich Wandler- und CTC-basierte Modelle. Es bietet sowohl C++- als auch Python-APIs.
Dieses Projekt konzentriert sich auf die Bereitstellung, dh die Verwendung vorab trainierter Modelle zur Transkription von Sprache. Wenn Sie daran interessiert sind, wie Sie Ihre eigenen Modelle trainieren oder verfeinern können, wenden Sie sich bitte an icefall.
Wir haben auch andere ähnliche Projekte, die nicht von PyTorch abhängen:
sherpa-onnx
undsherpa-ncnn
unterstützen auch iOS, Android und eingebettete Systeme.
Bitte beachten Sie die Dokumentation unter https://k2-fsa.github.io/sherpa/
Probieren Sie sherpa
in Ihrem Browser aus, ohne etwas zu installieren: https://huggingface.co/spaces/k2-fsa/automatic-speech-recognition