KwaiAgentsダウンロード - KwaiAgentsソースコードのダウンロード

KwaiAgents

その他のソースコード

1.0.0

ダウンロード

英語｜中国語｜日本語

データセット |ベンチマーク | ?モデル | ?紙

KwaiAgents は、Kuaishou Technology の KwaiKEG によってオープンソース化されている一連のエージェント関連の作品です。オープンソースのコンテンツには次のものが含まれます。

KAgentSys-Lite : 論文内の KAgentSys のライトバージョン。 KAgentSys-Lite は、元のシステムの機能の一部を保持していますが、フル機能の対応するシステムと比較すると、次のような特定の違いと制限があります。(1) より限定されたツールセット。 (2) 記憶機構の欠如。 (3) パフォーマンス能力がわずかに低下します。 (4) BabyAGI や Auto-GPT などのオープンソースプロジェクトから進化した、異なるコードベース。これらの変更にもかかわらず、KAgentSys-Lite は、利用可能な多数のオープンソースエージェントシステムの中で同等のパフォーマンスを提供します。
KAgentLMs : 計画、反映、ツールの使用などのエージェント機能を備えた一連の大規模な言語モデル。この論文で提案されているメタエージェントのチューニングを通じて取得されます。
KAgentInstruct : 論文で提案されている 200,000 を超えるエージェント関連の命令微調整データ (部分的に人間が編集)。
KAgentBench : 計画、ツールの使用、反映、結論、プロファイリングなどの評価要素を含む、エージェントの機能をテストするための人が編集した 3,000 を超える自動評価データ。

タイプ	モデル	トレーニングデータ	ベンチマークデータ
クウェン	クウェン-7B-MAT クウェン-14B-MAT Qwen-7B-MAT-cpp クウェン1.5-14B-MAT	KAgentInstruct	KAgentベンチ
白川	白川2-13B-MAT	KAgentInstruct	KAgentベンチ

ニュース

2024.4.19 - Qwen1.5-14B-MAT モデル [リンク] をリリースしました。
2024.4.9 - ベンチマーク結果が更新されました。
2024.1.29 - Qwen-14B-MAT モデル [リンク] をリリースしました。
2023.1.5 - トレーニングデータ [リンク] を公開しました。
2023.12.27 - KwaiAgents が多くのサイトで報告されました。 [机之心] [中] [InfoQ] など
2023.12.13 - ベンチマークと評価コード [リンク] を公開しました。
2023.12.08 - 技術レポート [リンク] を公開しました。
2023.11.17 - 初回リリース。

評価

ベンチマーク結果

	規模	企画	工具の使用	反射	結論	プロフィール	総合スコア
GPT-3.5ターボ	-	18.55	26.26	8.06	37.26	35.42	25.63
ラマ2	13B	0.15	0.44	0.14	16.60	17.73	5.30
チャットGLM3	6B	7.87	11.84	7.52	1月30日	30.14	15.88
クウェン	7B	13.34	18.00	7.91	36.24	34.99	21.17
バイチュアン2	13B	6.70	16.10	6.76	24.97	19.08	14.89
ツールラマ	7B	0.20	4.83	1.06	15.62	10.66	6.04
AgentLM	13B	0.17	0.15	0.05	16.30	15.22	4.88
クウェンマット	7B	31.64	43.30	33.34	44.85	44.78	39.85
百川2-MAT	13B	37.27	52.97	37.00	48.01	41.83	45.34
クウェンマット	14B	43.17	63.78	32.14	45.47	45.22	49.94
クウェン1.5-MAT	14B	42.42	64.62	30.58	46.51	45.95	50.18

人間的な評価。各結果セルには、合格率 (%) と平均スコア (括弧内) が表示されます。

	規模	エージェントなし	反応する	自動 GPT	KAgentSys
GPT-4	-	57.21% (3.42)	68.66% (3.88)	79.60% (4.27)	83.58% (4.47)
GPT-3.5ターボ	-	47.26% (3.08)	54.23% (3.33)	61.74% (3.53)	64.18% (3.69)
クウェン	7B	52.74% (3.23)	51.74% (3.20)	50.25% (3.11)	54.23% (3.27)
バイチュアン2	13B	54.23% (3.31)	55.72% (3.36)	57.21% (3.37)	58.71% (3.54)
クウェンマット	7B	-	58.71% (3.53)	65.67% (3.77)	67.66% (3.87)
百川2-MAT	13B	-	61.19% (3.60)	66.67% (3.86)	74.13% (4.11)

ユーザーガイド

プリビルド環境

まずはビルド環境用のminicondaをインストールします。次に、最初にビルド環境を作成します。

conda create -n kagent python=3.10
conda activate kagent
pip install -r requirements.txt

AgentLM の使用

vLLM (GPU) によるサービス

モデル推論サービスをデプロイするには、vLLM と FastChat を使用することをお勧めします。まず、対応するパッケージをインストールする必要があります (詳しい使用方法については、2 つのプロジェクトのドキュメントを参照してください)。

Qwen-7B-MAT の場合は、次のコマンドを使用して対応するパッケージをインストールします。

pip install vllm
pip install " fschat[model_worker,webui] "

Baichuan-13B-MAT の場合は、次のコマンドを使用して対応するパッケージをインストールします。

pip install " fschat[model_worker,webui] "
pip install vllm==0.2.0
pip install transformers==4.33.2

KAgentLM を展開するには、まず 1 つの端末でコントローラーを起動する必要があります。

python -m fastchat.serve.controller

次に、単一 GPU 推論サービスをデプロイするには、別の端末で次のコマンドを使用する必要があります。

python -m fastchat.serve.vllm_worker --model-path $model_path --trust-remote-code

$model_pathは、ダウンロードされたモデルのローカルパスです。 GPU が Bfloat16 をサポートしていない場合は、コマンドラインに--dtype halfを追加できます。

次に、3 番目の端末で REST API サーバーを起動します。

python -m fastchat.serve.openai_api_server --host localhost --port 8888

最後に、curl コマンドを使用して、OpenAI 呼び出し形式と同じモデルを呼び出すことができます。以下に例を示します。

curl http://localhost:8888/v1/chat/completions 
-H " Content-Type: application/json " 
-d ' {"model": "kagentlms_qwen_7b_mat", "messages": [{"role": "user", "content": "Who is Andy Lau"}]} '

ここで、 kagentlms_qwen_7b_matデプロイしたモデルに変更します。

Lamma.cpp (CPU) によるサービス

llama-cpp-python は、OpenAI API のドロップイン代替として機能することを目的とした Web サーバーを提供します。これにより、llama.cpp 互換モデルを OpenAI 互換クライアント (言語ライブラリ、サービスなど) で使用できるようになります。変換されたモデルは kwaikeg/kagentlms_qwen_7b_mat_gguf にあります。

サーバーパッケージをインストールして開始するには、次の手順を実行します。

pip install " llama-cpp-python[server] "
python3 -m llama_cpp.server --model kagentlms_qwen_7b_mat_gguf/ggml-model-q4_0.gguf --chat_format chatml --port 8888

最後に、curl コマンドを使用して、OpenAI 呼び出し形式と同じモデルを呼び出すことができます。以下に例を示します。

curl http://localhost:8888/v1/chat/completions 
-H " Content-Type: application/json " 
-d ' {"messages": [{"role": "user", "content": "Who is Andy Lau"}]} '

KAgentSys-Lite の使用

KwaiAgents をダウンロードしてインストールします。Python 3.10 以上を推奨します。

git clone [email protected]:KwaiKEG/KwaiAgents.git
cd KwaiAgents
python setup.py develop

ChatGPT の使用法いくつかの環境変数を宣言する

 export OPENAI_API_KEY=sk-xxxxx
export WEATHER_API_KEY=xxxxxx

WEATHER_API_KEY は必須ではありませんが、天気関連の質問をする場合は設定する必要があります。 APIキーはこちらのWebサイトから取得できます（ローカルモデル利用時も同様）。

kagentsys --query= " Who is Andy Lau's wife? " --llm_name= " gpt-3.5-turbo " --lang= " en "

ローカルモデルの使用法

ローカルモデルを使用するには、前の章で説明したように、対応するモデルサービスをデプロイする必要があります。

kagentsys --query= " Who is Andy Lau's wife? " --llm_name= " kagentlms_qwen_7b_mat " 
--use_local_llm --local_llm_host= " localhost " --local_llm_port=8888 --lang= " en "

完全なコマンド引数:

 options:
  -h, --help            show this help message and exit
  --id ID               ID of this conversation
  --query QUERY         User query
  --history HISTORY     History of conversation
  --llm_name LLM_NAME   the name of llm
  --use_local_llm       Whether to use local llm
  --local_llm_host LOCAL_LLM_HOST
                        The host of local llm service
  --local_llm_port LOCAL_LLM_PORT
                        The port of local llm service
  --tool_names TOOL_NAMES
                        the name of llm
  --max_iter_num MAX_ITER_NUM
                        the number of iteration of agents
  --agent_name AGENT_NAME
                        The agent name
  --agent_bio AGENT_BIO
                        The agent bio, a short description
  --agent_instructions AGENT_INSTRUCTIONS
                        The instructions of how agent thinking, acting, or talking
  --external_knowledge EXTERNAL_KNOWLEDGE
                        The link of external knowledge
  --lang {en,zh}        The language of the overall system
  --max_tokens_num      Maximum length of model input

注記：

browse_websiteツールを使用する必要がある場合は、サーバー上で chromedriver を構成する必要があります。
検索が複数回失敗する場合は、ネットワークがduckduckgo_searchにアクセスできないことが原因である可能性があります。これはhttp_proxy設定することで解決できます。

カスタムツールの使用

カスタムツールの使用法は、examples/custom_tool_example.py にあります。

KAgentBench 評価の使用

エージェントの機能を評価するには、次のような 2 行だけが必要です。

 cd benchmark
python infer_qwen.py qwen_benchmark_res.jsonl
python benchmark_eval.py ./benchmark_eval.jsonl ./qwen_benchmark_res.jsonl

上記のコマンドでは次のような結果が得られます

 plan : 31.64, tooluse : 43.30, reflextion : 33.34, conclusion : 44.85, profile : 44.78, overall : 39.85

詳細については、ベンチマーク/を参照してください。

引用

 @article{pan2023kwaiagents,
  author    = {Haojie Pan and
               Zepeng Zhai and
               Hao Yuan and
               Yaojia Lv and
               Ruiji Fu and
               Ming Liu and
               Zhongyuan Wang and
               Bing Qin
               },
  title     = {KwaiAgents: Generalized Information-seeking Agent System with Large Language Models},
  journal   = {CoRR},
  volume    = {abs/2312.04889},
  year      = {2023}
}

拡大する

追加情報