sherpa
doc
sherpa
는 PyTorch를 사용하는 오픈 소스 음성-텍스트-텍스트 추론 프레임워크로, E2E(end-to-end) 모델, 즉 변환기 및 CTC 기반 모델 에만 중점을 둡니다. C++ 및 Python API를 모두 제공합니다.
이 프로젝트는 사전 훈련된 모델을 사용하여 음성을 기록하는 배포에 중점을 둡니다. 자신의 모델을 훈련하거나 미세 조정하는 방법에 관심이 있다면 icefall을 참조하세요.
PyTorch에 의존하지 않는 다른 유사한 프로젝트도 있습니다.
sherpa-onnx
및sherpa-ncnn
iOS, Android 및 임베디드 시스템도 지원합니다.
https://k2-fsa.github.io/sherpa/의 설명서 를 참조하세요.
아무것도 설치하지 않고 브라우저 내에서 sherpa
사용해 보세요: https://huggingface.co/spaces/k2-fsa/automatic-speech-recognition