Esta es una aplicación de voz a texto para WhatsApp que usa Whisper y WhatsApp-Web.js, que se ejecuta en Docker
Una vez autenticado en WhatsApp Web, el trabajador transcribirá todos los mensajes de voz a los que responde con el comando! Tran usando Whisper. Actualmente, solo está configurado para transcribir mensajes de contactos guardados en su libro de contacto.
Originalmente, el programa usó el discurso en la nube de Google, pero ahora usa Whisper, que es un motor de reconocimiento de voz ligero y de código abierto.
Si no desea alojar el modelo directamente en su computadora, puede usar la rama Main_openai_api , que utiliza la API OpenAI para transcribir el audio.
Si desea contribuir, simplemente envíe una solicitud de extracción.
Solo responde al mensaje de voz con el que desea transcribir ! Tran
docker-compose build
docker-compose up
(no se separe, el QR se mostrará en el terminal)docker-compose.yml
. Los valores predeterminados son: deploy :
resources :
reservations :
devices :
- driver : nvidia
count : 1
capabilities : [gpu]
responseMsgHeader
y responseMsgHeaderError
dentro del nodo/index.js . Puede configurar el encabezado del mensaje para la respuesta automática.fetchMessages()
de whatsapp-web.js, la función que maneja esto se llama downloadQuotedMedia()