Whatsapp_speech_to_text
1.0.0
이것은 Whisper와 Whatsapp-web.js를 사용하는 WhatsApp에 대한 음성-텍스트 응용 프로그램입니다.
WhatsApp 웹에서 인증되면 작업자는 Whisper를 사용하여 Command! Tran과 함께 답장하는 모든 음성 메시지를 전사합니다. 현재 연락처 북에 저장된 연락처에서 메시지를 전사하도록 구성됩니다.
원래이 프로그램은 Google Cloud Speech를 사용했지만 이제는 가볍고 오픈 소스 음성 인식 엔진 인 Whisper를 사용합니다.
컴퓨터에서 모델을 직접 호스팅하지 않으려면 OpenAI API를 사용하여 오디오를 전사하는 main_openai_api 브랜치를 사용할 수 있습니다.
기여하려면 풀 요청을 보내십시오.
전사하고 싶은 음성 메시지에 답장하십시오 ! Tran
docker-compose build
실행합니다docker-compose up
실행하려면 (분리하지 마십시오. QR이 터미널에 표시됩니다)docker-compose.yml
파일 내부의 환경 변수를 편집합니다. 기본값은 다음과 같습니다. deploy :
resources :
reservations :
devices :
- driver : nvidia
count : 1
capabilities : [gpu]
responseMsgHeader
및 responseMsgHeaderError
. 자동 응답을 위해 메시지 헤더를 설정할 수 있습니다.fetchMessages()
를 사용하여 고정되었습니다 downloadQuotedMedia()