KwaiAgents下載 - KwaiAgents原始碼下載

KwaiAgents

其他源碼

1.0.0

下載

English ｜中文 | 日本語

數據集 |基準| ？型號| ？紙

KwaiAgents是快手科技KwaiKEG開源的Agent相關系列作品。開源內容包括：

KAgentSys-Lite ：論文中 KAgentSys 的精簡版。 KAgentSys-Lite在保留原有系統的部分功能的同時，與全功能的系統相比也存在一定的差異和局限性，例如：（1）工具集更加有限； (2)缺乏記憶機制； (3) 性能能力略有下降； (4) 不同的程式碼庫，因為它是從 BabyAGI 和 Auto-GPT 等開源專案發展而來的。儘管進行了這些修改，KAgentSys-Lite 仍然提供與眾多可用開源 Agent 系統相當的效能。
KAgentLMs ：一系列具有規劃、反射、工具使用等代理能力的大型語言模型，透過論文中提出的元代理調優獲得。
KAgentInstruct ：論文中提出的超過 200k 條與 Agent 相關的指令微調資料（部分人工編輯）。
KAgentBench ：超過3000個人工編輯的自動化評估數據，用於測試Agent能力，評估維度包括規劃、工具使用、反思、總結和分析。

類型	型號	訓練資料	基準數據
奎文	Qwen-7B-MAT Qwen-14B-MAT Qwen-7B-MAT-cpp Qwen1.5-14B-MAT	KA代理指令	KA代理工作台
百川	百川2-13B-MAT	KA代理指令	KA代理工作台

訊息

2024年4月19日 - Qwen1.5-14B-MAT模型[連結]發布。
2024.4.9 - 基準結果已刷新。
2024年1月29日 - Qwen-14B-MAT模型[連結]發布。
2023.1.5 - 訓練資料[連結]發布。
2023.12.27 - KwaiAgents 被多個網站舉報。 [機器之心][Medium][InfoQ]等
2023.12.13 - 基準測試和評估代碼[連結]發布。
2023.12.08 - 技術報告[連結]發布。
2023.11.17 - 初始版本。

評估

基準測試結果

	規模	規劃	工具使用	反射	結論	輪廓	總分
GPT-3.5-渦輪	-	18.55	26.26	8.06	37.26	35.42	25.63
駱駝2	13B	0.15	0.44	0.14	16.60	17.73	5.30
聊天GLM3	6B	7.87	11.84	7.52	30.01	30.14	15.88
奎文	7B	13.34	18:00	7.91	36.24	34.99	21.17
百川2	13B	6.70	16.10	6.76	24.97	19.08	14.89
工具羊駝	7B	0.20	4.83	1.06	15.62	10.66	6.04
代理LM	13B	0.17	0.15	0.05	16.30	15.22	4.88
Qwen-MAT	7B	31.64	43.30	33.34	44.85	44.78	39.85
百川2-MAT	13B	37.27	52.97	37:00	48.01	41.83	45.34
Qwen-MAT	14B	43.17	63.78	32.14	45.47	45.22	49.94
Qwen1.5-MAT	14B	42.42	64.62	30.58	46.51	45.95	50.18

人類評價。每個結果單元格顯示通過率（%）和平均分數（括號內）

	規模	無代理	反應	自動GPT	KAgent系統
GPT-4	-	57.21% (3.42)	68.66% (3.88)	79.60% (4.27)	83.58% (4.47)
GPT-3.5-渦輪	-	47.26% (3.08)	54.23% (3.33)	61.74% (3.53)	64.18% (3.69)
奎文	7B	52.74% (3.23)	51.74% (3.20)	50.25% (3.11)	54.23% (3.27)
百川2	13B	54.23% (3.31)	55.72% (3.36)	57.21% (3.37)	58.71% (3.54)
Qwen-MAT	7B	-	58.71% (3.53)	65.67% (3.77)	67.66% (3.87)
百川2-MAT	13B	-	61.19% (3.60)	66.67% (3.86)	74.13% (4.11)

使用者指南

預先建置環境

先安裝 miniconda 建置環境。然後先建立建置環境：

conda create -n kagent python=3.10
conda activate kagent
pip install -r requirements.txt

使用 AgentLM

由 vLLM (GPU) 提供服務

我們建議使用 vLLM 和 FastChat 來部署模型推理服務。首先需要安裝對應的套件（詳細使用方法請參考兩個項目的文件）：

對於Qwen-7B-MAT，使用以下命令安裝相應的軟體包

pip install vllm
pip install " fschat[model_worker,webui] "

對於Baichuan-13B-MAT，使用以下命令安裝相應的套件

pip install " fschat[model_worker,webui] "
pip install vllm==0.2.0
pip install transformers==4.33.2

要部署 KAgentLM，您首先需要在一個終端機中啟動控制器。

python -m fastchat.serve.controller

其次，您應該在另一個終端機使用以下命令進行單GPU推理服務部署：

python -m fastchat.serve.vllm_worker --model-path $model_path --trust-remote-code

其中$model_path是下載的模型的本機路徑。如果GPU不支援Bfloat16，可以在命令列中加入--dtype half 。

第三，在第三個終端機中啟動 REST API 伺服器。

python -m fastchat.serve.openai_api_server --host localhost --port 8888

最後，您可以使用curl指令來呼叫模型，與OpenAI呼叫格式相同。這是一個例子：

curl http://localhost:8888/v1/chat/completions 
-H " Content-Type: application/json " 
-d ' {"model": "kagentlms_qwen_7b_mat", "messages": [{"role": "user", "content": "Who is Andy Lau"}]} '

在這裡，將kagentlms_qwen_7b_mat更改為您部署的模型。

由Lamma.cpp (CPU) 提供服務

llama-cpp-python 提供了一個 Web 伺服器，旨在充當 OpenAI API 的直接替代品。這允許您將 llama.cpp 相容模型與任何 OpenAI 相容客戶端（語言庫、服務等）一起使用。轉換後的模型可以在 kwaikeg/kagentlms_qwen_7b_mat_gguf 中找到。

要安裝伺服器套件並開始：

pip install " llama-cpp-python[server] "
python3 -m llama_cpp.server --model kagentlms_qwen_7b_mat_gguf/ggml-model-q4_0.gguf --chat_format chatml --port 8888

最後，您可以使用curl指令來呼叫模型，與OpenAI呼叫格式相同。這是一個例子：

curl http://localhost:8888/v1/chat/completions 
-H " Content-Type: application/json " 
-d ' {"messages": [{"role": "user", "content": "Who is Andy Lau"}]} '

使用 KAgentSys-Lite

下載並安裝KwaiAgents，推薦Python>=3.10

git clone [email protected]:KwaiKEG/KwaiAgents.git
cd KwaiAgents
python setup.py develop

ChatGPT 使用宣告一些環境變數

 export OPENAI_API_KEY=sk-xxxxx
export WEATHER_API_KEY=xxxxxx

WEATHER_API_KEY不是強制性的，但在詢問天氣相關問題時需要配置它。您可以從該網站取得API金鑰（本機模型使用相同）。

kagentsys --query= " Who is Andy Lau's wife? " --llm_name= " gpt-3.5-turbo " --lang= " en "

本地模型使用

要使用本地模型，需要按照上一章部署對應的模型服務

kagentsys --query= " Who is Andy Lau's wife? " --llm_name= " kagentlms_qwen_7b_mat " 
--use_local_llm --local_llm_host= " localhost " --local_llm_port=8888 --lang= " en "

完整命令參數：

 options:
  -h, --help            show this help message and exit
  --id ID               ID of this conversation
  --query QUERY         User query
  --history HISTORY     History of conversation
  --llm_name LLM_NAME   the name of llm
  --use_local_llm       Whether to use local llm
  --local_llm_host LOCAL_LLM_HOST
                        The host of local llm service
  --local_llm_port LOCAL_LLM_PORT
                        The port of local llm service
  --tool_names TOOL_NAMES
                        the name of llm
  --max_iter_num MAX_ITER_NUM
                        the number of iteration of agents
  --agent_name AGENT_NAME
                        The agent name
  --agent_bio AGENT_BIO
                        The agent bio, a short description
  --agent_instructions AGENT_INSTRUCTIONS
                        The instructions of how agent thinking, acting, or talking
  --external_knowledge EXTERNAL_KNOWLEDGE
                        The link of external knowledge
  --lang {en,zh}        The language of the overall system
  --max_tokens_num      Maximum length of model input

筆記：

如果需要使用browse_website工具，則需要在伺服器上設定chromedriver。
如果多次搜尋失敗，可能是因為網路無法存取duckduckgo_search。您可以透過設定http_proxy來解決此問題。

使用自訂工具

自訂工具的使用可以在examples/custom_tool_example.py中找到

使用KAgentBench評估

我們只需要兩行來評估代理人的能力，例如：

 cd benchmark
python infer_qwen.py qwen_benchmark_res.jsonl
python benchmark_eval.py ./benchmark_eval.jsonl ./qwen_benchmark_res.jsonl

上面的命令將給出類似的結果

 plan : 31.64, tooluse : 43.30, reflextion : 33.34, conclusion : 44.85, profile : 44.78, overall : 39.85

請參閱基準/了解更多詳細資訊。

引文

 @article{pan2023kwaiagents,
  author    = {Haojie Pan and
               Zepeng Zhai and
               Hao Yuan and
               Yaojia Lv and
               Ruiji Fu and
               Ming Liu and
               Zhongyuan Wang and
               Bing Qin
               },
  title     = {KwaiAgents: Generalized Information-seeking Agent System with Large Language Models},
  journal   = {CoRR},
  volume    = {abs/2312.04889},
  year      = {2023}
}

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2024-11-30
大小 7.8MB
來自於 Github

相關應用

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
SmartTube

其他源碼

24.71 Stable
Sunamu

其他源碼

Release 2.2.0
waymo open dataset

其他源碼

December 2023 Update
wp functions

其他類別

1.0.0
termwind

其他類別

v2.3.0

相關資訊全部