コミュニティ |ドキュメント |ダッシュボード
Outspeed は、音声およびビデオ入力でリアルタイム AI アプリケーションを構築するための PyTorch からインスピレーションを得た SDK です。それは以下を提供します:
音声アシスタント、ビデオ分析、およびオーディオビジュアルデータを処理するその他のリアルタイム AI アプリケーションの開発に最適です。
outspeed
SDK を pypi からインストールするには、次を使用します。
pip install "outspeed[silero]>=0.1.143"
これにより、コアoutspeed
パッケージがインストールされます。開始するには、クイックスタート ガイドをお読みください。
SDK の詳細については、ドキュメントを参照してください。
Outspeed のインフラ上にリアルタイム機能をデプロイするには、 outspeed deploy
CLI を使用できます。
# functions.py contains your realtime function code
outspeed deploy --api-key= functions.py
API キーを取得してデプロイするには、お問い合わせください。
デプロイ後は、サンプル リポジトリのプレイグラウンドを使用して、デプロイされたコードをテストできます。
すべての例は、 examples
フォルダーにあります。すべての例が実行されるようにパッケージをインストールするには、次を使用します。
pip install "outspeed[silero]>=0.1.143"
または、詩を使用している場合:
poetry add 'outspeed[silero]'
これにより、サンプルが動作するために必要な追加ライブラリがすべてインストールされます。
SDK 上で開発するには、環境変数DEV_INFO
またはDEV_DEBUG
を設定して、対応するログ レベルのログを SDK から取得します。
特徴 | 状態 | ターゲットリリース |
---|---|---|
ローカルSTT | 途中で | 2024 年第 4 四半期 |
DeepReel の統合 (ヒューマン クローン) | 途中で | 2024 年第 4 四半期 |
長時間会話のサポート | 計画済み | 2024 年第 4 四半期 |
ローカル モデルのビジョンとテキスト (Ollama およびビジョン モデルを使用) | 計画済み | 2024 年第 4 四半期 |
通話録音 | 計画済み | 2024 年第 4 四半期 |
ウェイクアップワード | 計画済み | 2024 年第 4 四半期 |
デバイスモデルについて | 計画済み | 2024 年第 4 四半期 |
ローカルTTS | 計画済み | 2024 年第 4 四半期 |
docker がインストールされ、実行されていることを確認してください。
brew install circleci
circleci local execute run-tests
Outspeed SDK への貢献を歓迎します。貢献にご興味がございましたら、PR を送信するか、お問い合わせください。