( l聽 | t認為 | s峰值)
100% 免費的本地離線助手,具有語音識別和對講功能。
ALTS 在背景運行並等待您按cmd+esc
(或win+esc
)。
按住熱鍵時,您的聲音將被錄製(保存在專案根目錄中) 。
發布後,錄音停止,並將成績單發送給法學碩士(錄音被刪除) 。
然後,LLM 回覆會被合成並播放給您(也顯示為桌面通知) 。
您可以在config.yaml
中修改熱鍵組合和其他設定。
所有進程都是本地的,您的任何記錄或查詢都不會離開您的環境;錄音一經使用即被刪除;預設都是私有的
(已測試)macOS 上的版本 >=3.11 和 Windows 上的版本 >=3.8
預設情況下,該專案配置為與 Ollama 一起使用,運行stablelm2
模型(一個非常小且快速的模型)。這種設置使整個系統完全可以在本地運行,非常適合資源匱乏的機器。
然而,我們使用 LiteLLM 是為了與提供者無關,因此您可以完全自由地選擇自己的組合。查看支援的模型/供應商,以了解有關 LLM 配置的更多詳細資訊。
請參閱
.env.template
和config-template.yaml
以自訂您的設置
我們使用openAI's whisper
來轉錄您的語音查詢。它是一種通用語音辨識模型。
您需要在您的環境中安裝ffmepg
,您可以從官方網站下載它。
請務必查看他們的設定文檔,以了解任何其他要求。
如果您遇到錯誤,原因之一可能是模型未自動下載。如果是這種情況,您可以在終端機中執行
whisper
範例轉錄(請參閱範例)或手動下載它並將模型檔案放入正確的資料夾中
我們使用 ALTS 的coqui-TTS
與您回覆。它是一個用於高級文字轉語音生成的庫。
您需要在您的環境中安裝eSpeak-ng
:
請務必查看他們的設定文檔,以了解任何其他要求。
如果您還沒有下載配置的模型,它應該在啟動期間自動下載,但是如果您遇到任何問題,可以透過執行以下命令來預先下載預設模型:
tts --text "this is a setup test" --out_path test_output.wav --model_name tts_models/en/vctk/vits --speaker_idx p364預設型號有多個“揚聲器”可供選擇;運行以下命令將提供一個演示站點,您可以在其中測試可用的不同聲音:
tts-server --model_name tts_models/en/vctk/vits
macOS –brew brew install espeak
Linux – sudo apt-get install espeak -y
windows – 從他們的儲存庫下載可執行文件
在Windows上,您還需要
Desktop development with C++
和.NET desktop build tools
進行桌面開發。下載 Microsoft C++ 建置工具並安裝這些相依性。
克隆儲存庫
git clone https://github.com/alxpez/alts.git
轉到主資料夾
cd alts/
安裝專案依賴項
pip install -r requirements.txt
請參閱先決條件部分,以確保您的電腦已準備好啟動 ALTS
複製並重命名所需的設定文件
cp config-template.yaml config.yaml
cp .env.template .env
根據您的需求修改預設配置
啟動 ALTS
sudo python alts.py
keyboard
包需要以管理員身分運行(在 macOS 和 Linux 中),但在 Windows 上則不然