(じっと聞く|考える| ピークに達する)
音声認識とトークバック機能を備えた完全無料のローカルおよびオフライン アシスタントです。
ALTS はバックグラウンドで実行され、 cmd+esc
(またはwin+esc
) が押されるのを待ちます。
ホットキーを押している間、あなたの声が録音されます(プロジェクトのルートに保存されます) 。
解放されると、録音は停止し、トランスクリプトが LLM に送信されます(録音は削除されます) 。
その後、LLM 応答が合成されて再生されます(デスクトップ通知としても表示されます) 。
config.yaml
でホットキーの組み合わせとその他の設定を変更できます。
すべてのプロセスはローカルであり、記録やクエリは環境から離れることはありません。録音は使用されるとすぐに削除されます。デフォルトではすべてプライベートです
(テスト済み) macOS ではバージョン 3.11 以上、Windows ではバージョン 3.8 以上
デフォルトでは、プロジェクトは Ollama で動作し、 stablelm2
モデル (非常に小さくて高速なモデル) を実行するように構成されています。この設定により、システム全体が完全に無料でローカルで実行できるようになり、リソースの少ないマシンに最適になります。
ただし、プロバイダーに依存しないようにするために LiteLLM を使用しているため、独自の組み合わせを完全に自由に選択できます。 LLM 構成の詳細については、サポートされているモデル/プロバイダーを参照してください。
セットアップのカスタマイズについては、
.env.template
およびconfig-template.yaml
を参照してください。
openAI's whisper
使用して、音声クエリを文字に起こします。汎用の音声認識モデルです。
ffmepg
環境にインストールする必要があります。公式サイトからダウンロードできます。
その他の要件については、セットアップ ドキュメントを必ず確認してください。
エラーが発生した場合は、モデルが自動的にダウンロードされていないことが原因の 1 つである可能性があります。その場合は、ターミナルで
whisper
例の文字起こしを実行するか (例を参照)、手動でダウンロードしてモデル ファイルを正しいフォルダーに配置します。
ALTS 向けのcoqui-TTS
使用して、あなたへのトークバックを行っています。これは、高度な Text-to-Speech 生成のためのライブラリです。
eSpeak-ng
環境にインストールする必要があります。
その他の要件については、セットアップ ドキュメントを必ず確認してください。
構成済みのモデルがまだダウンロードされていない場合は、起動時に自動的にダウンロードされますが、問題が発生した場合は、次のコマンドを実行することでデフォルトのモデルを事前にダウンロードできます。
tts --text "this is a setup test" --out_path test_output.wav --model_name tts_models/en/vctk/vits --speaker_idx p364デフォルトのモデルには、いくつかの「スピーカー」から選択できます。次のコマンドを実行すると、利用可能なさまざまな音声をテストできるデモ サイトが提供されます。
tts-server --model_name tts_models/en/vctk/vits
macOS – brew install espeak
Linux – sudo apt-get install espeak -y
Windows – リポジトリから実行可能ファイルをダウンロードします
Windowsでは、
Desktop development with C++
および.NET desktop build tools
を使用したデスクトップ開発も必要です。 Microsoft C++ Build Tools をダウンロードし、これらの依存関係をインストールします。
リポジトリのクローンを作成する
git clone https://github.com/alxpez/alts.git
メインフォルダーに移動します
cd alts/
プロジェクトの依存関係をインストールする
pip install -r requirements.txt
前提条件セクションを参照して、マシンが ALTS を開始する準備ができていることを確認してください。
必要な構成ファイルを複製して名前を変更します
cp config-template.yaml config.yaml
cp .env.template .env
必要に応じてデフォルトの構成を変更します
ALTSを起動する
sudo python alts.py
keyboard
パッケージは管理者として実行する必要があります (macOS および Linux の場合)。Windows の場合はそうではありません