LocalAIVoiceChat下載 - LocalAIVoiceChat原始碼下載

LocalAIVoiceChat

Ai源碼

Initial Release

下載

本地AI語音聊天

提供與 AI 的即時對話，完全在您的 PC 上本地進行，具有可自訂的 AI 個性和語音。

提示：任何對最先進的語音解決方案感興趣的人也請看看 Linguflex 。它可以讓你透過說話來控制你的環境，是目前最強大、最複雜的開源助理之一。

注意：如果您遇到「一般綜合錯誤：isin() 收到無效的參數組合」錯誤，這是由於新的 Transformer 程式庫引入了與 Coqui TTS 的不相容性（請參閱此處）。請降級到較舊的 Transformer 版本： pip install transformers==4.38.2或將 RealtimeTTS 升級到最新版本pip install realtimetts==0.4.1 。

關於項目

將強大的 Zephyr 7B 語言模型與即時語音轉文字和文字轉語音庫集成，創建快速且引人入勝的基於語音的本地聊天機器人。

Local.AI.Talkbot.GithubClip.mov

提示：如果您在安裝 llama.cpp 時遇到問題，請查看我的 LocalEmotionalAIVoiceChat 專案。它包括情感感知的即時文字到語音輸出，並具有多個 LLM 提供者選項。您也可以將它與不同的人工智慧模型一起使用。

技術堆疊

llama_cpp與 Zephyr 7B
- 基於 llama 的語言模型的函式庫接口
帶 fast_whisper 的RealtimeSTT
- 即時語音轉文字轉錄庫
使用 Coqui XTTS進行即時 TTS
- 即時文字轉語音合成庫

筆記

軟體處於實驗性 alpha 狀態，不提供生產就緒的穩定性。目前用於合成的 XTTS 模型仍然存在故障，而且 Zephyr（雖然對於 7B 模型來說確實很好）當然無法與 GPT 4、Claude 或 Perplexity 的答案品質競爭。

請將此作為提供本地即時聊天機器人的早期版本的首次嘗試。

更新

更新至 Coqui XTTS 2.0 模型
修復 RealtimeTTS（Coqui 模型下載無法正常運作）

先決條件

您將需要具有大約 8 GB VRAM 的 GPU 才能即時執行此程式。

對於 nVidia 用戶

NVIDIA CUDA 工具包 11.8 ：
- 存取 NVIDIA CUDA 工具包存檔。
- 選擇版本 11.x 並按照說明進行下載和安裝。
適用於 CUDA 11.x 的 NVIDIA cuDNN 8.7.0 ：
- 導航至 NVIDIA cuDNN 檔案。
- 找到並下載「cuDNN v8.7.0（2022 年 11 月 28 日），適用於 CUDA 11.x」。
- 請遵循提供的安裝指南。

對於 AMD 用戶

安裝 ROCm v.5.7.1
- 下載 ROCm SDK 版本 5.7.1
- 請遵循提供的安裝指南。
FFmpeg ：
根據您的作業系統安裝 FFmpeg：
- Ubuntu/Debian ：
```
sudo apt update && sudo apt install ffmpeg
```
- 拱門Linux ：
```
sudo pacman -S ffmpeg
```
- macOS（自製） ：
```
brew install ffmpeg
```
- Windows（巧克力） ：
```
choco install ffmpeg
```
- 窗戶（湯匙） ：
```
scoop install ffmpeg
```

安裝步驟

克隆儲存庫或下載原始碼包。
安裝llama.cpp
- （對於 AMD 使用者）在下一步之前將環境變數LLAMA_HIPBLAS值設為on
- 官方方式：
```
 pip install llama - cpp - python - - force - reinstall - - upgrade - - no - cache - dir - - verbose
```
- 如果官方安裝不適合你，請安裝text- Generation-webui，它為許多平台和環境提供了一些優秀的輪子

安裝實時庫

安裝主要庫：

 pip install RealtimeSTT == 0.1 . 7
pip install RealtimeTTS == 0.2 . 7

從此處下載 zephyr-7b-beta.Q5_K_M.gguf。
- 開啟creation_params.json並將下載模型的檔案路徑輸入到model_path 。
- 調整 n_gpu_layers（0-35，如果您有更多 VRAM，則提高）和 n_threads（CPU 線程數，我建議不要使用所有可用核心，但留一些用於 TTS）

如果發生依賴衝突，請安裝衝突庫的特定版本：

 pip install networkx == 2.8 . 8
pip install typing_extensions == 4.8 . 0
pip install fsspec == 2023.6 . 0
pip install imageio == 2.31 . 6
pip install numpy == 1.24 . 3
pip install requests == 2.31 . 0

運行應用程式

 python ai_voicetalk_local.py

客製化

改變AI個性

開啟 chat_params.json 更改談話場景。

改變人工智慧語音

開啟 ai_voicetalk_local.py。
找到這一行：coqui_engine = CoquiEngine(cloning_reference_wav="female.wav", language="en")
將“female.wav”更改為包含要複製的語音的波形檔案（44100 或 22050 Hz 單聲道 16 位元）的檔案名