Androidスマートウォッチの同様のバージョンについては、他のRepo GPT-Assistants-InterLinkを参照してください。このプロジェクトは、OpenaiのアシスタントAPIを利用しています。
(古い完成エンジン用に作られ、ChatGptのために改造されました。現代のものほど良くありません。見続けてください。)
これは、マイクを使用してChatGPTまたはGPT-4と魅力的で安全に感情的に話し合う会話をすることができるボットです。話すのではなく入力したい場合は、端末を介してボットと会話することもできます。
このツールは、変更されたGPTチャットプリセットを使用し、会話を追跡することを処理し、デフォルトでChatGPTのAPIを使用します。 GPTに何かを伝えることができ、セッションで言ったことを覚えています。また、必要に応じてボットに時間の経過とともにあなたの記憶を開発させることもできます。 GPTの最大トークンカウントに基づいた制限にもかかわらず、GPT-VCCは、あなたが話していることについて意識を失うことなく、あなたと会話することができるはずです。このツールを使用するには、有効なOpenAI APIキーが必要です。
ボットでは、Openaiの節度とGPT APIがあまりにも多くの遅延なく適切に動作する必要があります。ここでステータスを見つけることができます:https://status.openai.com/
リリースは、以前のテストに関する限り安定している必要がありますが、最新のすべての機能はすべて揃っているわけではありません。ここにリストされているすべての機能を希望する場合は、リポジトリをクローンして「Git Pull」を時々実行します。これにより、最新の機能とバグ修正が来ると、不安定になる可能性があります。
(注:Wisetechは私のボットインスタンスがそれ自体に選んだ名前です)
まず、OpenAI APIキーが必要です。アカウントを作成してAPIキーを取得してください:https://openai.com/api/。
サインインしたら、右上隅の「個人」のテキストの横にある円を押します。次に、「APIキーの表示」を押します。
「新しいシークレットキーを作成」を押してから、そのキーを保存します。それがGPT-VCCを実行するために必要な鍵です。次の方法で含まれるキーTXTファイルに貼り付けます。
OpenAI_Key={paste here without brackets}
画面の左側にある[請求]タブに移動します。 GPT-VCCを使用し続けるために、無料クレジットがなくなったら、支払い計画を開始してください。
https://www.python.org/でpythonをダウンロードする
このリポジトリをリリース、gitのクローン化、または右上に向かってコードボタンを押して「zipをダウンロード」するかのいずれかをダウンロードします。
内容を抽出し、ファイルでフォルダーに移動します。
Windowsターミナルがインストールされている場合は、フォルダーの空の部分を右クリックして、[ターミナルで開く]を選択します。それ以外の場合は、Win + Rを使用してPowerShellを入力します。ターミナルウィンドウに、適切なディレクトリに「PIP Install -R Reportions.txt -Upgrade」を使用したら。これが正常に行われた場合は、OpenAI APIキーを手に入れるとすぐに準備ができている必要があります。
GPT-VCCを使用してリストされている手順に従ってください
PIP3をインストールします
sudo apt install python3-pip
このリポジトリをリリース、gitのクローン化、または右上に向かってコードボタンを押して「zipをダウンロード」するかのいずれかをダウンロードします。
ファイルを抽出し、ディレクトリに移動し、Open Recumentis.txtを開き、ファイルからpyaudio == 0.2.13を削除します。それが決してそこになかったように見せて、元のフォーマットを保存します。
次のようにpyaudioをaptでダウンロードしてください:
sudo apt install python3-pyaudio
次のようにaptを使用してEspeakをダウンロードします(インターフェイス通信に必要です):
sudo apt install espeak
次のようにPIPで他の要件をダウンロードしてください。
pip3 install -r requirements.txt --upgrade
GPT-VCCを使用してリストされている手順に従ってください
このチャットボットを使用するには、ボットのフォルダーに移動したら次のコマンドを入力します(<key>をAPIキーに置き換えます):
python main.py <key>
便宜上、keys.txtファイルにキーを入力するだけです。スクリプトを実行すると、ボットはこのファイルを自動的に読み取り、キーをロードします。
Pygame GUIがポップアップします。その色はボットの状態を表しています。色の色は、ボットが聞いていないことを示します。ボットに耳を傾けるには、スペースを押してください。色は、荷重時に黄色に変わり、聞いているときは緑に変わります。色が緑の場合は自由に話し、スピーチが記録され、テキストに変換され、Openaiのポリシーに準拠している場合はGPTに給餌されます。 GPTが返信する準備ができたら、画面は青くなります。
端末を使用する場合は、代わりに同じ構文を使用してGPTCLI.pyを実行します(キーファイルも機能します)。
python gptcli.py <key>
ElevenLabs TTSを使用したい場合は、OpenAI APIキーに続いてPersonal ElevenLabs APIキーを次のように入力するか、キーファイルのキーに入力する必要があります。
python main.py <OpenAI key> <ElevenLabs TTS key>
派手なTTSを使用したくない場合は、このボットはGoogleのTTSを自動的に使用します。
節度では、OpenAIのモデレーションツールとNLTKの両方を使用しています。組み合わせることで、彼らはOpenaiの使用ポリシーの外にあるGPTの使用を防ぐことを望んでいます。ただし、これは故障可能な方法ではないため、GPTに与えたものに注意してください。
モデレートAPIの停止または潜伏期の問題により、このチャットボットの使用が妨げられることに注意してください。 Openaiが問題を抱えている間にボットと話をする必要がある場合は、chatbot.pyファイルを編集して、「not self.flagged_by_openai(text)」条件を除外してください。私はこれをお勧めしません。
プログラムを開始するときに渡された引数を使用したい場合は、代替声を使用できるようになりました。将来的には、これを行うためのより肉付けされた方法が計画されています。とりあえず、使用する音声のIDを知る必要があります(ベースボイスIDのリストをここに見つけることができます)。そのIDがわかったら、レイチェルの例ID "21M00TCM4TLVDQ8IKWAM"で次のように使用します。
python main.py --voice_id 21m00Tcm4TlvDq8ikWAM
クローンされた声を使用するには、次のことを行います。
https://beta.elevenlabs.io/voice-labの音声ラボに移動し、カスタム音声を作成します。
音声がクローン化されたら、https://api.elevenlabs.io/docs#/voices/get_voices_v1_voices_getにアクセスしてください。
「Try It Out」を押し、APIキーをボックスに入力し、「実行」を押します。
[実行]ボタンの下には、「Response Body」というラベルの付いたボックスが表示されます。名前の声が見つかるまで、このボックスを下にスクロールします。その真上の「Voice_id」を取得し、上記の例のように使用します。
SpaceBar :これにより、録音が開始され、停止します。次に、あなたが言うことは何でも、2回目のスペースを押すと、転写され、GPTに送信されます(フィルターに合格する場合)。
脱出:これは覚えなく終了します。
Q :これはやめて、あなたとあなたの会話についての詳細を覚えています(データはmememeeries.txtというテキストファイルに保存されます)
P :これは、メッセージをキャンセルするための減価償却コマンドです。キャンセルするために録音中に「メッセージをキャンセルしてください」と言ってください。
「トークンを#に設定してください」 :ボットがこのフレーズを認識したら、指定した値への返信のmax_tokensを設定しようとします。
「ロボットのように話す」と言う:これにより、GPTのすべての応答がオフラインで動作するロボットTTSプログラムで話すように設定します。 CLIモードでは、 '!robospeak()'を入力して、このモードを切り替えます。
「ロボットのように話すのをやめて」と言ってください。これにより、ボットのTTSを以前のもの(GoogleまたはElevenLabs TTS)に戻します。 CLIモードでは、 '!robospeak()'を入力して、このモードを切り替えます。
「会話を表示してください」と言ってください。これにより、会話全体が端末ウィンドウに出力されます。
「思い出を表示してください」と言ってください。これは、長期的なストレージに保存されたすべての記憶の出力を提供します。
「メモリを復元してください」と言ってください。これは、長期的なストレージから一定数のメモリを統合することにより、ボットの作業メモリを修復しようとします。
「プリセットを設定してください」と言ってください。これにより、ボットのプリセット(すべての会話の開始時にAIに与えられたテキスト文字列)が設定されます。たとえば、プリセットは「海賊のように話す」とAIが海賊のように話すようにします。プリセットの例は、https://github.com/adri6336/gpt-voice-nversation-chatbot/wiki/example-presetsです。
「プリセットをリセットしてください」と言ってください:これにより、作成したプリセットが削除されます。
「名前を設定してください」と言ってください。これにより、Openaiの使用ポリシーに従っている限り、ボットの名前を指定するものに設定します。名前を設定した後、ボットは設定した名前で自分自身を参照します。
「GPT4を切り替えてください」と言ってください。これは、ChatGPTとGPT-4モデルを切り替えます。起動時には、スイッチが保存されます。 CLIモードでは、 '!gpt4()'を入力してモデルを切り替えます。
「創造性を設定してください」と言ってください。これにより、ボットのデフォルトのランダム性が1〜15(以前は9)の間で指定した値に設定されます。 CLIモードでは、#サインが0.01から1.5の間の値である '!Creativity(#)'を使用します。
「コマンドをリストしてください」と言ってください:これにより、ボットリストに利用可能なコマンドが表示されます。
「ElevenLabsを切り替えてください」と言ってください。これにより、ボットのElevenLabs TTSの使用とオフの使用が切り替えます。 CLIモードでは、!11ai()を使用して切り替えます。
「メッセージをキャンセルしてください」と言ってください。これにより、メッセージがキャンセルされ、GPTに送信されなくなります。
ChatGPTまたはGPT-4とパーソナライズされた会話をしてください
GPTがGoogleのTTSツール(可能であれば、アクセントを正確に発音します)、ElevenLabのライフのようなTTS(有効なAPIキーがある場合)、またはロボットとして(「ロボットのように話す」とアクティブ化する)
Googleのスピーチ認識技術を使用して、GPT Outloudと話をしてください
「Q」キーを閉じると、ボットはあなたのことを覚えています
ターミナルウィンドウのテキストとしてのGPTの返信を参照してください。ほとんどのUTF-32文字(中国語やアラビア語のテキストなど)も印刷されます
ディスクのファイルへの会話を自動的に保存して、話したことを追跡するのに役立ちます
カスタムプリセットを保存して、あなたとあなたのニーズにより適したエクスペリエンスを持っています
ボットの名前をカスタマイズします
ボットの創造性をカスタマイズします
端末(WindowsとLinux)を介してGPTとチャット
レクリエーションでボットと会話します
BOTを使用して、設定プリセットで言語を練習して、その言語で教師のようにあなたに話しかけ、GoogleのTTSを使用して適切な宣言で応答を聞きます。あなたが望むなら、あなたはまた、11の多言語の声に固執することができます
質問をし、コードについてフィードバックをすることで、プログラミングを練習するのに役立ちます
ポップアップするさまざまなことについてボットの質問をしてください
カバーレターと説明を書くのに役立つボットに尋ねてください
11の音声デモンストレーション
Google TTSスペインの音声デモンストレーション