เพิ่มขีดความสามารถของตัวแทน AI อิสระอย่างแท้จริงผ่านการเรียนรู้การเสริมแรงวิวัฒนาการของฝ่ายตรงข้าม
เว็บไซต์
กระดาษขาว
กระดาษเทค
เอกสาร
โทรเลข
Twitter/x
ภาพรวม
คุณสมบัติ
เริ่มต้น
การติดตั้ง
ส่วนประกอบ
ลูปวิวัฒนาการ
คำแนะนำโดยละเอียด
ใบอนุญาต
การบริจาค
การอ้างอิง
Evolverl เป็นกรอบการทำงานที่ก้าวล้ำซึ่งช่วยให้ตัวแทน AI ได้รับการพัฒนาตนเองผ่านกลไกวิวัฒนาการและกลไก ซึ่งแตกต่างจากวิธีการดั้งเดิมที่พึ่งพาอย่างหนักในด้านวิศวกรรมที่พร้อมใช้งานด้วยตนเอง Evolverl ช่วยให้ตัวแทนสามารถสร้างทดสอบและปรับแต่งพรอมต์และการกำหนดค่าของตนเองอย่างเป็นระบบลดช่องว่างระหว่างความเป็นอิสระทางทฤษฎีและการพึ่งพาตนเองที่แท้จริง
ในเศรษฐกิจตัวแทน AI ที่เกิดขึ้นใหม่หลายคนจินตนาการถึงอนาคตที่ตัวแทนทำงานอิสระด้วยการกำกับดูแลของมนุษย์น้อยที่สุด อย่างไรก็ตามหากมนุษย์ต้องอัปเดต AI อย่างต่อเนื่องเพื่อจัดการกับงานใหม่หรือกรณีที่ได้เปรียบตัวแทนจะไม่ได้รับการอธิปไตยอย่างแท้จริง Evolverl แก้ปัญหานี้โดยการเปิดใช้งานการพัฒนาตนเองอย่างต่อเนื่องผ่าน:
Evolution Autonomous : ตัวแทนตรวจจับช่องว่างและอัปเดตพรอมต์ของตนเอง
การทดสอบฝ่ายตรงข้าม : การตรวจสอบความถูกต้องที่แข็งแกร่งต่อสถานการณ์ที่ท้าทาย
การเลือกตามประสิทธิภาพ : การเกิดขึ้นตามธรรมชาติของการกำหนดค่าที่ดีที่สุด
การปรับตัวอย่างต่อเนื่อง : การตอบสนองแบบเรียลไทม์ต่อเงื่อนไขการเปลี่ยนแปลง
การเพิ่มประสิทธิภาพเชิงวิวัฒนาการ : วิวัฒนาการแจ้งและพฤติกรรมโดยใช้อัลกอริทึมทางพันธุกรรม
Domain Agnostic : ความเชี่ยวชาญสำหรับโดเมนใด ๆ
การประเมินที่แข็งแกร่ง : การตัดสินและการประเมินผลที่ครอบคลุม
การทดสอบฝ่ายตรงข้าม : สร้างสถานการณ์ที่ท้าทายเพื่อให้แน่ใจว่ามีความแข็งแกร่ง
การจัดการสถานะ : บันทึกและโหลดแบบจำลองที่พัฒนาขึ้นและสถานะของพวกเขา
การสนับสนุนหลายรุ่น : ใช้ GPT ของ Openai หรือ Claude ของมานุษยวิทยาหรือเรียกใช้ Llama ในพื้นที่ (เร็ว ๆ นี้)
การพัฒนาตนเองลูป : วิวัฒนาการอย่างต่อเนื่องโดยไม่มีการแทรกแซงของมนุษย์
# การติดตั้งพื้นฐานการติดตั้ง EVOLVERL# ติดตั้งด้วยการติดตั้งทั้งหมดการติดตั้ง EVOLVERL [ทั้งหมด]
จาก Evolverl.evolution Import Evolution, EvolutionConfigFigFrom Evolverl.llm นำเข้า llmconfigfrom Evolverl.agent agent agent, agentconfig # กำหนดค่า llm backendllm_config = llmconfig (model_name = "gpt-4", model_type = "openai" -api-key " # หรือ anthropic_api_key สำหรับ claude) # สร้างเอเจนต์ด้วยระบบ promptagent_config = agentconfig (llm_config = llm_config) ตัวแทน = agent (agent_config) agent.set_default_prompt (" "" ปัญหาที่ซับซ้อนทีละขั้นตอนและแสดงงานของคุณอย่างชัดเจน "" ")# กำหนดค่า Evolution ProcessConfig = EvolutionConfig (population_size = 5, Generations = 10, mutation_rate = 0.1, crossover_rate = 0.8, output_dir =" ตัวแทน ") (config, experiment_id = "math_solver")# เรียกใช้วิวัฒนาการ processawait evolution.evolve (domain = "คณิตศาสตร์", คำอธิบาย = "แก้ปัญหาคณิตศาสตร์ที่ซับซ้อนพร้อมคำอธิบายโดยละเอียด")
นอกจากนี้คุณยังสามารถใช้ตัวแทนโดยตรงโดยไม่มีวิวัฒนาการ:
# สร้างและกำหนดค่า agentagent = agent (agentconfig (llm_config = llm_config)) agent.set_default_prompt ("คุณเป็นผู้ช่วย AI ที่เป็นประโยชน์ ... ")# ส่งข้อความ = รอ Agent.send_message ("2+2") (การตอบสนอง)
train_agent.py
เป็นไฟล์เดียว CLI ที่เรียกใช้กระบวนการวิวัฒนาการ ตรวจสอบให้แน่ใจว่าได้อัปเดตไฟล์ config default_config.json
ก่อนรวมถึงให้คีย์ OpenAI หรือ API ของคุณเป็นตัวแปรสภาพแวดล้อมหรือใน .env
# การใช้งานขั้นพื้นฐานด้วย openaipython train_agent.py -โดเมนคณิตศาสตร์ -คำอธิบาย "แก้ปัญหาคณิตศาสตร์" -v# ใช้ claudepython train_agent.py -นักมานุษยวิทยา -โดเมนคณิตศาสตร์ -คำอธิบาย "แก้ปัญหาคณิตศาสตร์" train_agent.py-โดเมนโดเมน-ไฟล์/math_solver.json# directorypython output directorypython train_agent.py-โดเมนคณิตศาสตร์-คำอธิบาย "... "-OUTPUT-DIR ./MY_AGENTS# เพิ่มคำสั่ง train_agent.py -โดเมนคณิตศาสตร์ -คำอธิบาย "... " -vvv
ตัวอย่างโดเมนปัจจุบันเป็นภาษาธรรมชาติ คุณสามารถเพิ่มรายละเอียดเพิ่มเติมเมื่อสร้างเคสใช้งานของคุณเอง นอกจากนี้คุณอาจรวมถึงตัวอย่างใด ๆ ที่คุณเชื่อว่าเป็นสิ่งสำคัญสำหรับตัวแทนที่จะรู้
agents/ ├── {experiment_id}_gen0.json # Best agent from generation 0 ├── {experiment_id}_gen0_full.json # All variants and scores from generation 0 ├── {experiment_id}_gen1.json # Best agent from generation 1 ├── {experiment_id}_gen1_full.json # All variants and scores from generation 1 └── {experiment_id}_best.json # Best agent overall
บุคคล .json
(ไม่ใช่ *_full.json
) มี AgentConfig
สำหรับตัวแทนที่ดีที่สุดของรุ่นหรือโดยรวม คุณสามารถเริ่มต้นตัวแทนโดยตรงจากไฟล์ AgentConfig
โดยการเรียก agent.load_config(PATH_TO_CONFIG_FILE)
ตรวจสอบให้แน่ใจว่าได้อัปเดตคีย์ API เนื่องจากจะไม่ถูกเก็บไว้ในไฟล์ AgentConfig
{"population_size": 5, "Generations": 10, "Mutation_rate": 0.1, "crossover_rate": 0.8, "min_score_threshold": 0.7, "Tournament_size": 2, "Max_interaction_attempts": 5, "เอาท์พุท": "agents" , "llm_config": {"model_name": "gpt-4o-mini", "model_type": "openai", "max_tokens": 500, "อุณหภูมิ": 0.7} -
agents/ ├── {experiment_id}_gen0.json # Best agent from generation 0 ├── {experiment_id}_gen0_full.json # All variants from generation 0 ├── {experiment_id}_gen1.json # Best agent from generation 1 ├── {experiment_id}_gen1_full.json # All variants from generation 1 └── {experiment_id}_best.json # Best agent overall
กระบวนการวิวัฒนาการแสดงความคืบหน้าแบบเรียลไทม์ด้วยแถบความคืบหน้าแบบซ้อนกัน:
Generation 2/10: 100%|██████████| 6/6 [00:15<00:00, best_score=0875, avg_score=0834] Overall Progress: 15%|██ | 12/80 [00:30<02:45, generation=2/10, best_overall=0875]
สิ่งนี้อาจใช้เวลาสักครู่ขึ้นอยู่กับจำนวนรุ่นและขนาดประชากรต่อรุ่น
ใบอนุญาต MIT - ดูไฟล์ใบอนุญาตสำหรับรายละเอียด
แยกที่เก็บ
สร้างสาขาคุณสมบัติ
กระทำการเปลี่ยนแปลงของคุณ
ผลักไปที่สาขา
สร้างคำขอดึง
@software {Evolverl2024, title = {evolverl: การเรียนรู้การเสริมแรงแบบวิวัฒนาการสำหรับ llms}, ผู้แต่ง = {thehandsomedev}, ปี = {2025}, url = {https://www.evolverl.com/}}}}}