Это приложение для речи к тексту для WhatsApp, которое использует Whisper и WhatsApp-Web.js, работающий на Docker
После аутентификации в WhatsApp Web работник будет транскрибировать все голосовые сообщения, на которые вы отвечаете с помощью команды! Tran, используя Whisper. В настоящее время он настроен только для транскрибирования сообщений из контактов, сохраненных в вашей контактной книге.
Первоначально программа использовала Google Cloud Speech, но теперь она использует Whisper, который представляет собой легкий двигатель распознавания речи с открытым исходным кодом.
Если вы не хотите размещать модель непосредственно на своем компьютере, вы можете использовать ветвь main_openai_api , которая использует API OpenAI для транскрибирования звука.
Если вы хотите внести свой вклад, просто отправьте запрос на привлечение.
Просто ответьте на голосовое сообщение, с которым вы хотите транскрибировать ! Tran
docker-compose build
docker-compose up
(не отсоедините, QR будет отображаться в терминале)docker-compose.yml
. Значения по умолчанию: deploy :
resources :
reservations :
devices :
- driver : nvidia
count : 1
capabilities : [gpu]
responseMsgHeader
и responseMsgHeaderError
ответов . Вы можете настроить заголовок сообщения для автоматического ответа.fetchMessages()
из WhatsApp-Web.js, функция, которая обрабатывает это, называется downloadQuotedMedia()