Unduh KnowAgent - Unduh kode Sumber KnowAgent

KnowAgent

Kode Sumber AI

1.0.0

Unduh

Perencanaan Bertambah Pengetahuan untuk Agen Berbasis LLM.

?Kertas • Web

metode

Perkembangan kami didasarkan pada beberapa langkah utama: Awalnya , kami menciptakan basis pengetahuan tindakan yang luas, yang menggabungkan pengetahuan perencanaan tindakan yang berkaitan dengan tugas-tugas tertentu. Basis data ini bertindak sebagai reservoir informasi eksternal, yang mengarahkan proses pembuatan tindakan model. Selanjutnya , dengan mengubah pengetahuan tindakan menjadi teks, kami memungkinkan model untuk memahami secara mendalam dan memanfaatkan pengetahuan ini dalam menciptakan lintasan tindakan. Terakhir , melalui fase pembelajaran mandiri yang berpengetahuan , kami menggunakan lintasan yang dikembangkan dari proses berulang model untuk terus meningkatkan pemahaman dan penerapan pengetahuan tindakan. Proses ini tidak hanya memperkuat kemampuan perencanaan agen tetapi juga meningkatkan potensi penerapannya dalam situasi yang kompleks.

?Daftar isi

?Daftar isi
?Berita
?Instalasi
?️Pembuatan Jalur Perencanaan
Belajar Mandiri yang Berpengetahuan
?Kutipan
Pengakuan

?Berita

[2024-03] Kami merilis makalah baru: "KnowAgent: Perencanaan Bertambah Pengetahuan untuk Agen Berbasis LLM".

?Instalasi

Untuk memulai KnowAgent, ikuti langkah-langkah instalasi sederhana berikut:

git clone https://github.com/zjunlp/KnowAgent.git
cd KnowAgent
pip install -r requirements.txt

Kami telah menempatkan kumpulan data HotpotQA dan ALFWorld masing-masing di bawah Path_Generation/alfworld_run/data dan Path_Generation/hotpotqa_run/data . Untuk konfigurasi lebih lanjut, kami menyarankan untuk melanjutkan dengan pengaturan awal ALFWorld dan FastChat.

?️ Pembuatan Jalur Perencanaan

Proses Pembuatan Jalur Perencanaan merupakan bagian integral dari KnowAgent. Anda dapat menemukan skrip untuk menjalankan Planning Path Generation di direktori Path_Generation , khususnya run_alfworld.sh dan run_hotpotqa.sh . Skrip ini dapat dijalankan menggunakan perintah bash. Untuk menyesuaikan skrip dengan kebutuhan Anda, Anda dapat memodifikasi parameter mode untuk beralih antara mode pelatihan ( train ) dan pengujian ( test ), dan mengubah parameter llm_name untuk menggunakan LLM yang berbeda:

 cd Path_Generation

# For training with HotpotQA
python run_hotpotqa.py --llm_name llama-2-13b --max_context_len 4000 --mode train --output_path ../Self-Learning/trajs/

# For testing with HotpotQA
python run_hotpotqa.py --llm_name llama-2-13b --max_context_len 4000 --mode test --output_path output/
    
# For training with ALFWorld
python alfworld_run/run_alfworld.py --llm_name llama-2-13b --mode train --output_path ../Self-Learning/trajs/

# For testing with ALFWorld
python alfworld_run/run_alfworld.py --llm_name llama-2-13b --mode test --output_path output/

Di sini kami merilis lintasan yang disintesis oleh Llama-{7,13,70}b-chat di Google Drive sebelum Filtering.

♟️Belajar Mandiri yang Berpengetahuan

Setelah mendapatkan jalur perencanaan dan lintasan yang sesuai, proses Belajar Mandiri Berpengetahuan dimulai. Lintasan yang dihasilkan terlebih dahulu harus diubah ke dalam format Alpaca menggunakan skrip yang terletak di direktori Self-Learning.

Untuk iterasi awal, ikuti langkah-langkah yang diuraikan dalam traj_reformat.sh :

 cd Self-Learning
# For HotpotQA
python train/Hotpotqa_reformat.py --input_path trajs/KnowAgentHotpotQA_llama-2-13b.jsonl --output_path train/datas

# For ALFWorld
python train/ALFWorld_reformat.py --input_path trajs/KnowAgentALFWorld_llama-2-13b.jsonl --output_path train/datas

Untuk iterasi berikutnya, penting untuk melakukan Penyaringan dan Penggabungan Lintasan Berbasis Pengetahuan sebelum menjalankan skrip pemformatan ulang lintasan. Anda dapat mencapainya menggunakan traj_merge_and_filter.sh :

 python trajs/traj_merge_and_filter.py 
    --task HotpotQA 
    --input_path1  trajs/datas/KnowAgentHotpotQA_llama-2-13b_D0.jsonl 
    --input_path2  trajs/datas/KnowAgentHotpotQA_llama-2-13b_D1.jsonl 
    --output_path   trajs/datas

Selanjutnya, mulai proses Self-Learning dengan menjalankan train.sh dan train_iter.sh , seperti yang ditentukan dalam skrip yang terletak di Self-Learning/train.sh dan Self-Learning/train_iter.sh :

 CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 deepspeed train/train_lora.py 
    --model_name_or_path  llama-2-13b-chat
    --lora_r 8 
    --lora_alpha 16 
    --lora_dropout 0.05 
    --data_path datas/data_knowagent.json 
    --output_dir models/Hotpotqa/M1 
    --num_train_epochs 5 
    --per_device_train_batch_size 2 
    --per_device_eval_batch_size 1 
    --gradient_accumulation_steps 1 
    --evaluation_strategy "no" 
    --save_strategy "steps" 
    --save_steps 10000 
    --save_total_limit 1 
    --learning_rate 1e-4 
    --weight_decay 0. 
    --warmup_ratio 0.03 
    --lr_scheduler_type "cosine" 
    --logging_steps 1 
    --fp16 True 
    --model_max_length 4096 
    --gradient_checkpointing True 
    --q_lora False 
    --deepspeed /data/zyq/FastChat/playground/deepspeed_config_s3.json 
    --resume_from_checkpoint False

?Kutipan

 @article { zhu2024knowagent ,
  title = { KnowAgent: Knowledge-Augmented Planning for LLM-Based Agents } ,
  author = { Zhu, Yuqi and Qiao, Shuofei and Ou, Yixin and Deng, Shumin and Zhang, Ningyu and Lyu, Shiwei and Shen, Yue and Liang, Lei and Gu, Jinjie and Chen, Huajun } ,
  journal = { arXiv preprint arXiv:2403.03101 } ,
  year = { 2024 }
}

Pengakuan

Kami mengucapkan terima kasih kepada pencipta dan kontributor proyek-proyek berikut, yang telah mempengaruhi perkembangan KnowAgent secara signifikan:
- FastChat : Kode modul pelatihan kami diadaptasi dari FastChat. Kunjungi FastChat, dan Integrasi dengan model terbuka melalui LangChain difasilitasi melalui FastChat. Pelajari lebih lanjut tentang Integrasi LangChain dan FastChat.
- BOLAA : Kode modul inferensi diimplementasikan berdasarkan BOLAA. Kunjungi BOLAA
- Kode dasar tambahan dari ReAct , Reflexion , FireAct , dan lainnya telah digunakan, menampilkan beragam pendekatan dan metodologi.
Terima kasih yang tulus kami sampaikan kepada semua kontributor atas kontribusi mereka yang tak ternilai di bidang ini!

?Kontributor

Kami akan menawarkan pemeliharaan jangka panjang untuk memperbaiki bug dan memecahkan masalah. Jadi jika Anda mempunyai masalah, silakan sampaikan masalahnya kepada kami.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-01-26
ukuran 4.83MB
Berasal dari Github

Aplikasi Terkait

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua