LLM based AI Assistant
1.0.0
這是一款基於大語言模型的AI語音助理。使用者可以使用自然語言(目前是英語)與語音助理互動。
此實現將各種深度學習模型結合在一起:
語音模組與本地麥克風連接,透過 VAD 過程創建即時轉錄。轉錄內容將發送至所選的法學碩士,以便根據喚醒詞進行處理。
一旦 LLM 產生回應,語音模組也會儲存音訊檔案並使用 TTS 模型產生語音輸出。
使用者介面是使用 Streamlit 建立的,並提供熟悉的類似聊天的體驗。
安裝專案依賴項
pip install -r requirements
如果使用 GPT 模型,請建立一個包含OPENAI_API_KEY
和OPENAI_API_BASE
環境變數的.env
檔案。