Eine einfache Schnittstelle zum OpenAI ChatGPT-Modell mit Sprache in Text für die Eingabe und Text in Sprache für die Ausgabe. chatgpt-voice-assistant verwendet OpenAI Whisper für die Sprachtranskription und OpenAI Speech Generation für TTS.
Abhängigkeiten installieren:
brew install portaudio
brew link portaudio
Aktualisieren Sie Ihre pydistutils-Konfigurationsdatei für die Portaudio-Nutzung, indem Sie Folgendes ausführen:
echo " [build_ext] " >> $HOME /.pydistutils.cfg
echo " include_dirs= " ` brew --prefix portaudio ` " /include/ " >> $HOME /.pydistutils.cfg
echo " library_dirs= " ` brew --prefix portaudio ` " /lib/ " >> $HOME /.pydistutils.cfg
Führen Sie Folgendes aus, um die CLI-Anwendung chatgpt-assist
zu installieren:
pip install chatgpt-voice-assistant
pip install poetry
)poetry install
Legen Sie entweder die Umgebungsvariable OPENAI_API_KEY
fest, bevor Sie das Skript ausführen, oder übergeben Sie Ihren geheimen Schlüssel an das Skript, wie im folgenden Beispiel:
export OPENAI_API_KEY= < OPEN API SECRET KEY HERE >
gptassist
# OR
gptassist --open-ai-key= < OPEN API SECRET KEY HERE >
oder wenn aus der Quelle mit Poesie installiert:
poetry run gptassist --open-ai-key= < OPEN API SECRET KEY HERE >
Beginnen Sie zu sprechen und erhöhen Sie die Lautstärke, um die Antwort des KI-Assistenten zu hören.
Sagen Sie das Wort „Beenden“ oder drücken Sie Strg+C in Ihrem Terminal, um die Anwendung zu stoppen.
Unten finden Sie das Hilfemenü der Chatgpt-Assist-CLI mit allen verfügbaren Optionen:
-h, --help
show this help message and exit
--log-level LOG_LEVEL
Whether to print at the debug level or not.
--input-device-name INPUT_DEVICE_NAME
The input device name.
--lang LANG
The language to listen for when running speech to text (ex. en or fr).
--max-tokens MAX_TOKENS
Max OpenAI completion tokens to use for text generation.
--tld TLD
Top level domain (ex. com or com.au).
--safe-word SAFE_WORD
Word to speak to exit the application.
--wake-word WAKE_WORD
(Optional) Word to trigger a response.
--open-ai-key OPEN_AI_KEY
Required. Open AI Secret Key (or set OPENAI_API_KEY environment variable)
--tts {apple,google,openai}
Choose a text-to-speech engine.
--speech-rate SPEECH_RATE
The rate at which to play speech. 1.0=normal
Geben Sie sowohl die Variablen LANGUAGE
als auch TOP_LEVEL_DOMAIN
an, um die Standardeinstellung Englisch (USA) zu überschreiben.
gptassist --open-ai-key= < OPENAI_KEY > --lang=en --tld=com
LANGUAGE=en TOP_LEVEL_DOMAIN=com
LANGUAGE=en TOP_LEVEL_DOMAIN=com.au
LANGUAGE=en TOP_LEVEL_DOMAIN=co.in
LANGUAGE=fr TOP_LEVEL_DOMAIN=fr
Weitere Informationen finden Sie im Abschnitt „Lokalisierte Akzente“ in der gTTS-Dokumentation