bolnaダウンロード - bolnaソースコードのダウンロード

bolna

その他のソースコード

v0.7.13

ダウンロード

エンドツーエンドのオープンソース音声エージェントプラットフォーム：JSONを介して音声を最初に会話アシスタントをすばやく構築します。

不和|ドキュメント| Webサイト

導入

Bolnaは、LLMベースの音声駆動型の会話アプリケーションを迅速に構築するためのエンドツーエンドのオープンソース生産準備準備完了フレームワークです。

デモ

Demo-Create-Agent-And-Make-Calls.mp4

コンポーネント

Bolnaは、次のようにタスクを実行するように指示できるAI音声エージェントの作成を支援します。

Twilio 、 Plivo 、 Exotelなどのテレフォニープロバイダーを使用して電話を開始します。
Deepgramなどを使用して会話を転写します。
OpenAI 、 Llama 、 Cohere 、 MistralなどのLLMを使用して会話を処理する
AWS Polly 、 XTTS 、 ElevenLabs 、 Deepgramなどを使用したテレフォニーへのLLM応答の合成。
エージェントに、メールの送信、テキストメッセージ、予約カレンダーなどのタスクを実行するように指示することで、会話が終了した後

サポートされているすべてのプロバイダーへの深いディービングについては、ドキュメントを参照してください。

ローカルの例セットアップ

基本的なローカルセットアップには、テレフォニーのためのTwilioまたはPlivoの使用が含まれます。 local_setup/のセットアップをDockerizedにしました。 .env.sampleから環境.envファイルを入力する必要があります。

セットアップは4つのコンテナで構成されています。

テレフォニーWebサーバー：
- Twilioの選択：呼び出しを開始するには、Twilioアカウントを設定する必要があります
- plivoの選択：呼び出しを開始するには、plivoアカウントを設定する必要があります
BOLNAサーバー：エージェントの作成と処理用
ngrok ：トンネリング用。 authtoken ngrok-config.ymlに追加する必要があります
redis ：エージェントの持続とプロンプトデータのため

dockerを使用して、環境ファイルとして.envファイルを使用して画像を構築し、ローカルに実行します

docker-compose build --no-cache <twilio-app | plivo-app> ：画像を再構築します
docker-compose up <twilio-app | plivo-app> ：ビルド画像を実行します

Dockerコンテナが起きたら、エージェントの作成を開始し、通話を開始するように指示できるようになりました。

エージェントの作成と呼び出しを呼び出します

上記のDockerのセットアップと実行を行うと、エージェントを作成して通話を開始できます。

以下のペイロードを使用して、 http://localhost:5001/agent経由でエージェントを作成します

エージェントペイロード

 {
    " agent_config " : {
        " agent_name " : " Alfred " ,
        " agent_type " : " other " ,
        " agent_welcome_message " : " Welcome " ,
        " tasks " : [
            {
                " task_type " : " conversation " ,
                " toolchain " : {
                    " execution " : " parallel " ,
                    " pipelines " : [
                        [
                            " transcriber " ,
                            " llm " ,
                            " synthesizer "
                        ]
                    ]
                },
                " tools_config " : {
                    " input " : {
                        " format " : " pcm " ,
                        " provider " : " twilio "
                    },
                    " llm_agent " : {
                        " agent_flow_type " : " streaming " ,
                        " provider " : " openai " ,
                        " request_json " : true,
                        " model " : " gpt-3.5-turbo-16k " ,
                        " use_fallback " : true
                    },
                    " output " : {
                        " format " : " pcm " ,
                        " provider " : " twilio "
                    },
                    " synthesizer " : {
                        " audio_format " : " wav " ,
                        " provider " : " elevenlabs " ,
                        " stream " : true,
                        " provider_config " : {
                            " voice " : " Meera - high quality, emotive " ,
                            " model " : " eleven_turbo_v2_5 " ,
                            " voice_id " : " TTa58Hl9lmhnQEvhp1WM "
                        },
                        " buffer_size " : 100.0
                    },
                    " transcriber " : {
                        " encoding " : " linear16 " ,
                        " language " : " en " ,
                        " provider " : " deepgram " ,
                        " stream " : true
                    }
                },
                " task_config " : {
                    " hangup_after_silence " : 30.0
                }
            }
        ]
    },
    " agent_prompts " : {
        " task_1 " : {
            " system_prompt " : " Ask if they are coming for party tonight "
        }
    }
}

前のAPIの応答は、 agent_idとしてuuidを返します。このagent_idを使用して、 http://localhost:8001/callで、 8001ポート（Twilio用）または8002ポート（Plivo用）で実行されているテレフォニーサーバーを介して通話を開始します

ペイロードを呼び出します

 {
    " agent_id " : " 4c19700b-227c-4c2d-8bgf-42dfe4b240fc " ,
    " recipient_phone_number " : " +19876543210 " ,
}

独自のプロバイダーを使用します

.envファイルを設置して、プロバイダーに独自のキーを使用できます。

ASRプロバイダー

これらは、現在サポートされているASRSプロバイダーです。

プロバイダー	`.env`ファイルに追加される環境変数
ディープグラム	`DEEPGRAM_AUTH_TOKEN`

LLMプロバイダー

BolnaはLitellmパッケージを使用して、複数のLLM統合をサポートします。

これらは、現在サポートされているLLMプロバイダーファミリーです：https：//github.com/bolna-ai/bolna/blob/477e08d6800dbf02931abeeea883d78451b7d7e2/bolna/providers.py#l29-l44

LitellmベースのLLMの場合、使用ケースに応じて.envファイルに次のいずれかを追加します。

LITELLM_MODEL_API_KEY ：LLMのAPIキー
LITELLM_MODEL_API_BASE ：ホストされたLLMのURL
LITELLM_MODEL_API_VERSION ：azureのようなllmsのAPIバージョン

VLLMを介してホストされているLLMSについては、 .envファイルに以下を追加します。
VLLM_SERVER_BASE_URL ：vllmを使用してホストされたLLMのURL

TTSプロバイダー

これらは、現在サポートされているTTSプロバイダーです：https：//github.com/bolna-ai/bolna/blob/c8a0d1428793d4df29133119e354bc2f85a7ca76/bolna/providers.py#l7l7l14

プロバイダー	`.env`ファイルに追加される環境変数
AWS POLLY	〜/.aws経由でシステム全体の資格情報からアクセス
evelenlabs	`ELEVENLABS_API_KEY`
Openai	`OPENAI_API_KEY`
ディープグラム	`DEEPGRAM_AUTH_TOKEN`

テレフォニープロバイダー

これらは現在サポートされているテレフォニープロバイダーです。

プロバイダー	`.env`ファイルに追加される環境変数
トワイリオ	`TWILIO_ACCOUNT_SID` 、 `TWILIO_AUTH_TOKEN` 、 `TWILIO_PHONE_NUMBER`
プリボ	`PLIVO_AUTH_ID` 、 `PLIVO_AUTH_TOKEN` 、 `PLIVO_PHONE_NUMBER`

他のテレフォニープロバイダーと一緒に拡張します

以下のガイドラインに従って、Vonage、Telnyxなどの他のテレフォニーを拡張して追加したい場合は次のとおりです。

双方向ストリーミングがテレフォニープロバイダーによってサポートされていることを確認してください
input_handlers/telepony_providersにテレフォニー固有の入力ハンドラーファイルを追加します。
1. このファイルには、主にテレフォニープロバイダーからさまざまな種類のイベントパケットがどのように摂取されているかが含まれます
output_handlers/theleas_providersのテレフォニー固有の出力ハンドラーファイルを追加するカスタム関数を作成するTelephony.pyクラスから拡張
1. これは主に、オーディオをシンセサイザークラスからサポートされているオーディオ形式に変換し、テレフォニープロバイダーが提供するWebSocketを介してストリーミングすることに関係しています
最後に、local_setupで提供されているTwilio_api_server.pyのような専用サーバーをWebSocketsで通話を開始する必要があります。

オープンソースv/sが支払われました

リポジトリは完全にオープンソースですが、管理されたホスト提供やカスタマイズされたソリューションに興味がある場合は、接続できます。

貢献

私たちはあらゆる種類の貢献を愛しています。このコミュニティリソースの改善において、大規模または小さいかどうか。

開始するのに良いものであることができる多くの未解決の問題があります
機能強化の提案がある場合は、タイプミスの修正などの簡単な修正を提供したり、見かけのバグに対処したい場合は、新しい問題を開始するか、プルリクエストを送信してください
このリポジトリへのより大きな変更または追加を検討している場合は、その構造であろうと機能の観点から、新しい問題を作成することから始めて、新しい問題を開き、提案された変更の概要を説明します。これにより、かなりの時間や努力を捧げる前に、議論に従事することができます。あなたの協力と理解は高く評価されています

拡大する

追加情報