提供與 AI 的即時對話,完全在您的 PC 上本地進行,具有可自訂的 AI 個性和語音。
提示:任何對最先進的語音解決方案感興趣的人也請看看 Linguflex 。它可以讓你透過說話來控制你的環境,是目前最強大、最複雜的開源助理之一。
注意:如果您遇到「一般綜合錯誤:isin() 收到無效的參數組合」錯誤,這是由於新的 Transformer 程式庫引入了與 Coqui TTS 的不相容性(請參閱此處)。請降級到較舊的 Transformer 版本:
pip install transformers==4.38.2
或將 RealtimeTTS 升級到最新版本pip install realtimetts==0.4.1
。
將強大的 Zephyr 7B 語言模型與即時語音轉文字和文字轉語音庫集成,創建快速且引人入勝的基於語音的本地聊天機器人。
提示:如果您在安裝 llama.cpp 時遇到問題,請查看我的 LocalEmotionalAIVoiceChat 專案。它包括情感感知的即時文字到語音輸出,並具有多個 LLM 提供者選項。您也可以將它與不同的人工智慧模型一起使用。
軟體處於實驗性 alpha 狀態,不提供生產就緒的穩定性。目前用於合成的 XTTS 模型仍然存在故障,而且 Zephyr(雖然對於 7B 模型來說確實很好)當然無法與 GPT 4、Claude 或 Perplexity 的答案品質競爭。
請將此作為提供本地即時聊天機器人的早期版本的首次嘗試。
您將需要具有大約 8 GB VRAM 的 GPU 才能即時執行此程式。
NVIDIA CUDA 工具包 11.8 :
適用於 CUDA 11.x 的 NVIDIA cuDNN 8.7.0 :
安裝 ROCm v.5.7.1
FFmpeg :
根據您的作業系統安裝 FFmpeg:
Ubuntu/Debian :
sudo apt update && sudo apt install ffmpeg
拱門Linux :
sudo pacman -S ffmpeg
macOS(自製) :
brew install ffmpeg
Windows(巧克力) :
choco install ffmpeg
窗戶(湯匙) :
scoop install ffmpeg
克隆儲存庫或下載原始碼包。
安裝llama.cpp
(對於 AMD 使用者)在下一步之前將環境變數LLAMA_HIPBLAS
值設為on
官方方式:
pip install llama - cpp - python - - force - reinstall - - upgrade - - no - cache - dir - - verbose
安裝實時庫
pip install RealtimeSTT == 0.1 . 7
pip install RealtimeTTS == 0.2 . 7
從此處下載 zephyr-7b-beta.Q5_K_M.gguf。
model_path
。如果發生依賴衝突,請安裝衝突庫的特定版本:
pip install networkx == 2.8 . 8
pip install typing_extensions == 4.8 . 0
pip install fsspec == 2023.6 . 0
pip install imageio == 2.31 . 6
pip install numpy == 1.24 . 3
pip install requests == 2.31 . 0
python ai_voicetalk_local.py
開啟 chat_params.json 更改談話場景。
如果第一個句子在第二個句子之前被轉錄,請在 AudioToTextRecorder 上提高AudioToTextRecorder(model="tiny.en", language="en", spinner=False, post_speech_silence_duration = 1.5)
熱烈歡迎為增強或改進該專案做出貢獻。請隨意打開一個拉取請求,其中包含您建議的更改或修復。
本專案採用 Coqui 公共模型授權 1.0.0。
該許可證僅允許機器學習模型及其輸出的非商業用途。
科爾賈·貝格爾
如果您有任何與該項目相關的疑問或支持,請隨時與我們聯繫。