sherpa
— это платформа вывода речи, текста и текста с открытым исходным кодом, использующая PyTorch и ориентированная исключительно на сквозные (E2E) модели, а именно модели на основе преобразователей и CTC. Он предоставляет API C++ и Python.
Этот проект фокусируется на развертывании, то есть использовании предварительно обученных моделей для расшифровки речи. Если вас интересует, как обучать или настраивать собственные модели, обратитесь к Icefall.
У нас также есть другие подобные проекты, не зависящие от PyTorch:
sherpa-onnx
иsherpa-ncnn
также поддерживают iOS, Android и встраиваемые системы.
Пожалуйста, обратитесь к документации по адресу https://k2-fsa.github.io/sherpa/.
Попробуйте sherpa
из браузера, ничего не устанавливая: https://huggingface.co/spaces/k2-fsa/automatic-speech-recognition