evolveRL Download - evolveRL Source Source Download

evolveRL

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

Evolverl: การเรียนรู้การเสริมแรงแบบวิวัฒนาการสำหรับ LLMS

เพิ่มขีดความสามารถของตัวแทน AI อิสระอย่างแท้จริงผ่านการเรียนรู้การเสริมแรงวิวัฒนาการของฝ่ายตรงข้าม

ลิงค์

เว็บไซต์
กระดาษขาว
กระดาษเทค
เอกสาร
โทรเลข
Twitter/x

สารบัญ

ภาพรวม
คุณสมบัติ
เริ่มต้น
การติดตั้ง
ส่วนประกอบ
ลูปวิวัฒนาการ
คำแนะนำโดยละเอียด
ใบอนุญาต
การบริจาค
การอ้างอิง

ภาพรวม

Evolverl เป็นกรอบการทำงานที่ก้าวล้ำซึ่งช่วยให้ตัวแทน AI ได้รับการพัฒนาตนเองผ่านกลไกวิวัฒนาการและกลไก ซึ่งแตกต่างจากวิธีการดั้งเดิมที่พึ่งพาอย่างหนักในด้านวิศวกรรมที่พร้อมใช้งานด้วยตนเอง Evolverl ช่วยให้ตัวแทนสามารถสร้างทดสอบและปรับแต่งพรอมต์และการกำหนดค่าของตนเองอย่างเป็นระบบลดช่องว่างระหว่างความเป็นอิสระทางทฤษฎีและการพึ่งพาตนเองที่แท้จริง

ความท้าทาย

ในเศรษฐกิจตัวแทน AI ที่เกิดขึ้นใหม่หลายคนจินตนาการถึงอนาคตที่ตัวแทนทำงานอิสระด้วยการกำกับดูแลของมนุษย์น้อยที่สุด อย่างไรก็ตามหากมนุษย์ต้องอัปเดต AI อย่างต่อเนื่องเพื่อจัดการกับงานใหม่หรือกรณีที่ได้เปรียบตัวแทนจะไม่ได้รับการอธิปไตยอย่างแท้จริง Evolverl แก้ปัญหานี้โดยการเปิดใช้งานการพัฒนาตนเองอย่างต่อเนื่องผ่าน:

Evolution Autonomous : ตัวแทนตรวจจับช่องว่างและอัปเดตพรอมต์ของตนเอง
การทดสอบฝ่ายตรงข้าม : การตรวจสอบความถูกต้องที่แข็งแกร่งต่อสถานการณ์ที่ท้าทาย
การเลือกตามประสิทธิภาพ : การเกิดขึ้นตามธรรมชาติของการกำหนดค่าที่ดีที่สุด
การปรับตัวอย่างต่อเนื่อง : การตอบสนองแบบเรียลไทม์ต่อเงื่อนไขการเปลี่ยนแปลง

คุณสมบัติ

การเพิ่มประสิทธิภาพเชิงวิวัฒนาการ : วิวัฒนาการแจ้งและพฤติกรรมโดยใช้อัลกอริทึมทางพันธุกรรม
Domain Agnostic : ความเชี่ยวชาญสำหรับโดเมนใด ๆ
การประเมินที่แข็งแกร่ง : การตัดสินและการประเมินผลที่ครอบคลุม
การทดสอบฝ่ายตรงข้าม : สร้างสถานการณ์ที่ท้าทายเพื่อให้แน่ใจว่ามีความแข็งแกร่ง
การจัดการสถานะ : บันทึกและโหลดแบบจำลองที่พัฒนาขึ้นและสถานะของพวกเขา
การสนับสนุนหลายรุ่น : ใช้ GPT ของ Openai หรือ Claude ของมานุษยวิทยาหรือเรียกใช้ Llama ในพื้นที่ (เร็ว ๆ นี้)
การพัฒนาตนเองลูป : วิวัฒนาการอย่างต่อเนื่องโดยไม่มีการแทรกแซงของมนุษย์

การติดตั้ง

 # การติดตั้งพื้นฐานการติดตั้ง EVOLVERL# ติดตั้งด้วยการติดตั้งทั้งหมดการติดตั้ง EVOLVERL [ทั้งหมด]

เริ่มต้นอย่างรวดเร็ว

 จาก Evolverl.evolution Import Evolution, EvolutionConfigFigFrom Evolverl.llm นำเข้า llmconfigfrom Evolverl.agent agent agent, agentconfig # กำหนดค่า llm backendllm_config = llmconfig (model_name = "gpt-4", model_type = "openai" -api-key " # หรือ anthropic_api_key สำหรับ claude) # สร้างเอเจนต์ด้วยระบบ promptagent_config = agentconfig (llm_config = llm_config) ตัวแทน = agent (agent_config) agent.set_default_prompt (" "" ปัญหาที่ซับซ้อนทีละขั้นตอนและแสดงงานของคุณอย่างชัดเจน "" ")# กำหนดค่า Evolution ProcessConfig = EvolutionConfig (population_size = 5, Generations = 10, mutation_rate = 0.1, crossover_rate = 0.8, output_dir =" ตัวแทน ") (config, experiment_id = "math_solver")# เรียกใช้วิวัฒนาการ processawait evolution.evolve (domain = "คณิตศาสตร์", คำอธิบาย = "แก้ปัญหาคณิตศาสตร์ที่ซับซ้อนพร้อมคำอธิบายโดยละเอียด")

การใช้ตัวแทนโดยตรง

นอกจากนี้คุณยังสามารถใช้ตัวแทนโดยตรงโดยไม่มีวิวัฒนาการ:

 # สร้างและกำหนดค่า agentagent = agent (agentconfig (llm_config = llm_config)) agent.set_default_prompt ("คุณเป็นผู้ช่วย AI ที่เป็นประโยชน์ ... ")# ส่งข้อความ = รอ Agent.send_message ("2+2") (การตอบสนอง)

การใช้งาน CLI

train_agent.py เป็นไฟล์เดียว CLI ที่เรียกใช้กระบวนการวิวัฒนาการ ตรวจสอบให้แน่ใจว่าได้อัปเดตไฟล์ config default_config.json ก่อนรวมถึงให้คีย์ OpenAI หรือ API ของคุณเป็นตัวแปรสภาพแวดล้อมหรือใน .env

 # การใช้งานขั้นพื้นฐานด้วย openaipython train_agent.py -โดเมนคณิตศาสตร์ -คำอธิบาย "แก้ปัญหาคณิตศาสตร์" -v# ใช้ claudepython train_agent.py -นักมานุษยวิทยา -โดเมนคณิตศาสตร์ -คำอธิบาย "แก้ปัญหาคณิตศาสตร์" train_agent.py-โดเมนโดเมน-ไฟล์/math_solver.json# directorypython output directorypython train_agent.py-โดเมนคณิตศาสตร์-คำอธิบาย "... "-OUTPUT-DIR ./MY_AGENTS# เพิ่มคำสั่ง train_agent.py -โดเมนคณิตศาสตร์ -คำอธิบาย "... " -vvv

ตัวอย่างโดเมนปัจจุบันเป็นภาษาธรรมชาติ คุณสามารถเพิ่มรายละเอียดเพิ่มเติมเมื่อสร้างเคสใช้งานของคุณเอง นอกจากนี้คุณอาจรวมถึงตัวอย่างใด ๆ ที่คุณเชื่อว่าเป็นสิ่งสำคัญสำหรับตัวแทนที่จะรู้

โครงสร้างเอาท์พุท

agents/
├── {experiment_id}_gen0.json           # Best agent from generation 0
├── {experiment_id}_gen0_full.json      # All variants and scores from generation 0
├── {experiment_id}_gen1.json           # Best agent from generation 1
├── {experiment_id}_gen1_full.json      # All variants and scores from generation 1
└── {experiment_id}_best.json           # Best agent overall

บุคคล .json (ไม่ใช่ *_full.json ) มี AgentConfig สำหรับตัวแทนที่ดีที่สุดของรุ่นหรือโดยรวม คุณสามารถเริ่มต้นตัวแทนโดยตรงจากไฟล์ AgentConfig โดยการเรียก agent.load_config(PATH_TO_CONFIG_FILE) ตรวจสอบให้แน่ใจว่าได้อัปเดตคีย์ API เนื่องจากจะไม่ถูกเก็บไว้ในไฟล์ AgentConfig

รูปแบบเอาต์พุตรุ่น

 {"population_size": 5, "Generations": 10, "Mutation_rate": 0.1, "crossover_rate": 0.8, "min_score_threshold": 0.7, "Tournament_size": 2, "Max_interaction_attempts": 5, "เอาท์พุท": "agents" , "llm_config": {"model_name": "gpt-4o-mini", "model_type": "openai", "max_tokens": 500, "อุณหภูมิ": 0.7}
-

โครงสร้างเอาท์พุท

agents/
├── {experiment_id}_gen0.json           # Best agent from generation 0
├── {experiment_id}_gen0_full.json      # All variants from generation 0
├── {experiment_id}_gen1.json           # Best agent from generation 1
├── {experiment_id}_gen1_full.json      # All variants from generation 1
└── {experiment_id}_best.json           # Best agent overall

การติดตามความคืบหน้า

กระบวนการวิวัฒนาการแสดงความคืบหน้าแบบเรียลไทม์ด้วยแถบความคืบหน้าแบบซ้อนกัน:

Generation 2/10: 100%|██████████| 6/6 [00:15<00:00, best_score=0875, avg_score=0834]
Overall Progress:  15%|██        | 12/80 [00:30<02:45, generation=2/10, best_overall=0875]

สิ่งนี้อาจใช้เวลาสักครู่ขึ้นอยู่กับจำนวนรุ่นและขนาดประชากรต่อรุ่น

ใบอนุญาต

ใบอนุญาต MIT - ดูไฟล์ใบอนุญาตสำหรับรายละเอียด

การบริจาค

แยกที่เก็บ
สร้างสาขาคุณสมบัติ
กระทำการเปลี่ยนแปลงของคุณ
ผลักไปที่สาขา
สร้างคำขอดึง

การอ้างอิง

 @software {Evolverl2024, title = {evolverl: การเรียนรู้การเสริมแรงแบบวิวัฒนาการสำหรับ llms}, ผู้แต่ง = {thehandsomedev}, ปี = {2025}, url = {https://www.evolverl.com/}}}}}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-02-14
ขนาด 4.95MB
มาจาก Github

แอปที่เกี่ยวข้อง

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
node telegram bot api

โค้ดแหล่งที่มา AI

v0.50.0
typebot.io

โค้ดแหล่งที่มา AI

v3.1.2
python wechaty getting started

โค้ดแหล่งที่มา AI

1.0.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
wp functions

หมวดหมู่อื่นๆ

1.0.0
termwind

หมวดหมู่อื่นๆ

v2.3.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด