Whatsapp_speech_to_text
1.0.0
これは、WhatsAppのスピーチツーテキストアプリケーションで、WhisperとWhatsApp-Web.jsを使用し、Dockerで実行されています
WhatsApp Webで認証されると、ワーカーは、Whisperを使用してコマンド!Tranで返信するすべての音声メッセージを転写します。現在、連絡先帳に保存されている連絡先からのメッセージを転写するようにのみ構成されています。
もともと、このプログラムはGoogle Cloud Speechを使用していましたが、今では軽量のオープンソースの音声認識エンジンであるWhisperを使用しています。
モデルをコンピューターで直接ホストしたくない場合は、OpenAI APIを使用してオーディオを転写するMain_openai_Apiブランチを使用できます。
貢献したい場合は、プルリクエストを送信してください。
転写したい音声メッセージに返信してください!tran
docker-compose build
を実行しますdocker-compose up
を実行します(デタッチしないでください、QRは端末に表示されます)docker-compose.yml
ファイル内の環境変数を編集します。デフォルト値は次のとおりです。 deploy :
resources :
reservations :
devices :
- driver : nvidia
count : 1
capabilities : [gpu]
responseMsgHeader
およびresponseMsgHeaderError
の編集。自動応答のメッセージヘッダーをセットアップできます。fetchMessages()
を使用して修正されましたdownloadQuotedMedia()