Este é um aplicativo de fala para texto para o WhatsApp que usa o Whatsapp-web.js, executando no Docker
Uma vez autenticado na Web Web, o trabalhador transcreverá todas as mensagens de voz a que você responde com o comando! Tran usando sussurro. Atualmente, ele só está configurado para transcrever mensagens de contatos salvos no seu livro de contato.
Originalmente, o programa usou o Google Cloud Speech, mas agora usa o Whisper, que é um mecanismo de reconhecimento de fala de código aberto e de código aberto.
Se você não deseja hospedar o modelo diretamente no seu computador, poderá usar a filial main_openai_api , que usa a API do OpenAI para transcrever o áudio.
Se você deseja contribuir, basta enviar uma solicitação de tração.
Basta responder à mensagem de voz que você deseja transcrever ! Tran
docker-compose build
docker-compose up
(não se destaque, o QR será exibido no terminal)docker-compose.yml
. Os valores padrão são: deploy :
resources :
reservations :
devices :
- driver : nvidia
count : 1
capabilities : [gpu]
responseMsgHeader
e responseMsgHeaderError
dentro do nó/index.js . Você pode configurar o cabeçalho da mensagem para obter a resposta automática.fetchMessages()
do WhatsApp-web.js, a função que lida com isso é chamada downloadQuotedMedia()