VoiceTrans — это (в основном) переводчик без помощи рук для изучающих язык. Идея состоит в том, чтобы позволить пользователю читать (физическую) книгу или статью непрерывно, запрашивая неизвестные слова естественным голосом.
Компоненты:
Сервер распознавания
Веб-интерфейс.
Интерфейс использует HTML5 Media Capture API для получения микрофонного потока с частотой 44 кГц и отправки его на сервер.
Сервер на лету выполняет повторную выборку до 16 кГц, максимума, приемлемого/значимого для серверной части распознавания голоса, и передает поток на серверную часть распознавания. Как только клиентский поток закрывается и становится доступен результат распознавания, он переводит распознанный текст и возвращает текстовую пару во внешний интерфейс для отображения.
Предпосылки:
Установите инструмент Stack с http://www.haskellstack.org.
Установите и запустите демон Docker. См. Установка и безопасность.
Компоненты:
voicetrans-server: stack image container
в этом каталоге.
voicetrans-frontend: do stack build -t treetide/voicetrans-frontend .
в этом реж.