تمكين عملاء الذكاء الاصطناعى الذاتي الذاتي من خلال تعلم التعزيز التطوري العدائي
موقع إلكتروني
ورقة بيضاء
الورقة الفنية
مستندات
برقية
Twitter/X.
ملخص
سمات
ابدء
تثبيت
عناصر
حلقة تطورية
تجول مفصل
رخصة
المساهمة
اقتباس
Evolverl هو إطار رائد يمكّن عملاء الذكاء الاصطناعى من التنفيذ الذاتي من خلال الآليات التطورية والعدوانية. على عكس الأساليب التقليدية التي تعتمد اعتمادًا كبيرًا على الهندسة المذهلة اليدوية ، يسمح Evolverl للوكلاء بإنشاء واختبار ومطالباتهم بشكل منهجي ، وسد الفجوة بين الحكم الذاتي النظري والاعتماد الفعلي على الذات.
في اقتصاد وكيل الذكاء الاصطناعى الناشئ ، يتصور الكثيرون مستقبلًا حيث يعمل الوكلاء بشكل مستقل مع الحد الأدنى من الرقابة البشرية. ومع ذلك ، إذا كان على البشر أن يقوموا باستمرار بتحديث مطالبات الذكاء الاصطناعي للتعامل مع المهام الجديدة أو حالات الحافة ، فإن الوكلاء ليسوا سياديًا حقًا. يحل Evolverl هذا عن طريق تمكين التحسين الذاتي المستمر من خلال:
التطور المستقل : يكتشف الوكلاء الفجوات ويحدثون مطالباتهم الخاصة
اختبار الخصومة : التحقق القوي ضد السيناريوهات الصعبة
الاختيار القائم على الأداء : ظهور طبيعي للتكوينات المثلى
التكيف المستمر : الاستجابة في الوقت الفعلي للظروف المتغيرة
التحسين التطوري : تطور المطالبات والسلوكيات باستخدام الخوارزميات الجينية
المجال اللاأدري : التخصص لأي مجال
تقييم قوي : الحكم والتقييم الشامل
اختبار الخصومة : توليد سيناريوهات صعبة لضمان المتانة
إدارة الدولة : حفظ وتحميل النماذج المتطورة وحالاتهم
دعم النماذج المتعددة : استخدم GPT من Openai أو كلودس ، أو تشغيل Llama محليًا (قريبًا)
حلقة تحسين الذات : تطور مستمر بدون تدخل بشري
# التثبيت الأساسي تثبيت Evolverl# تثبيت مع جميع التبعية تثبيت Evolverl [all]
من Evolverl.Evolution Import Evolution ، EvolutionConfigfromfrom Evolverl.llm Import LlmConfigfrom. -APi-key " # أو shinhOthS_API_KEY لـ CLAUDE) المشكلات المعقدة خطوة بخطوة وإظهار عملك بوضوح. "" "") (config ، experience_id = "math_solver")# قم بتشغيل التطور التطور.
يمكنك أيضًا استخدام الوكلاء مباشرة دون تطور:
# إنشاء وتكوين AgentAgent = Agent (AgentConfig (llm_config = llm_config)) Agent.set_default_prompt ("أنت مساعد مفيد AI ...") (إجابة)
train_agent.py
هو ملف واحد CLI يقوم بتشغيل عملية التطور. تأكد من تحديث ملف config default_config.json
أولاً ، وكذلك الحفاظ على مفتاح Openai أو Anthropic API كمتغيرات بيئة أو في .env
.
# الاستخدام الأساسي مع OpenAipython Train_agent.py -المجال الرياضيات -الوصف "حل مشاكل الرياضيات" -v# استخدم أنثروبريت كلوبيثون تورون_جنت. TRAIN_AGENT.PY-مجالات-دومين/MATH_SOLVER.JSON# مخصص الإخراج DIRECTORYTHON TRAIN_AGENT.PY-DOMAIN MATH-DESCRIPTION "..."-output-dir. Train_agent.py -Math -Domain -Description "..." -vvv
أمثلة المجال الحالية في اللغة الطبيعية. يمكنك إضافة المزيد من التفاصيل عند إنشاء حالات الاستخدام الخاصة بك. بالإضافة إلى ذلك ، يمكنك تضمين أي أمثلة تعتقد أنها مهمة للوكيل لمعرفة.
agents/ ├── {experiment_id}_gen0.json # Best agent from generation 0 ├── {experiment_id}_gen0_full.json # All variants and scores from generation 0 ├── {experiment_id}_gen1.json # Best agent from generation 1 ├── {experiment_id}_gen1_full.json # All variants and scores from generation 1 └── {experiment_id}_best.json # Best agent overall
يحتوي الفرد .json
(وليس *_full.json
) على AgentConfig
لأفضل وكيل للجيل أو بشكل عام. يمكنك بدء وكيل مباشرة من ملف AgentConfig
الخاص به عن طريق الاتصال agent.load_config(PATH_TO_CONFIG_FILE)
. تأكد من تحديث مفتاح API لأنه لن يتم تخزينه في ملف AgentConfig
.
{"compan_size": 5 ، "الأجيال": 10 ، "mutation_rate": 0.1 ، "Crossover_rate": 0.8 ، "min_score_threshold": 0.7 ، "tournament_size": 2 ، "max_interaction_attemps": 5 ، "Output_dir": "agents" ، "llm_config": {"model_name": "gpt-4o-mini" ، "model_type": "openai" ، "max_tokens": 500 ، "درجة الحرارة": 0.7} }
agents/ ├── {experiment_id}_gen0.json # Best agent from generation 0 ├── {experiment_id}_gen0_full.json # All variants from generation 0 ├── {experiment_id}_gen1.json # Best agent from generation 1 ├── {experiment_id}_gen1_full.json # All variants from generation 1 └── {experiment_id}_best.json # Best agent overall
تُظهر عملية التطور تقدمًا في الوقت الفعلي مع أشرطة التقدم المتداخلة:
Generation 2/10: 100%|██████████| 6/6 [00:15<00:00, best_score=0875, avg_score=0834] Overall Progress: 15%|██ | 12/80 [00:30<02:45, generation=2/10, best_overall=0875]
قد يستغرق هذا بعض الوقت اعتمادًا على عدد الأجيال وحجم السكان لكل جيل.
ترخيص معهد ماساتشوستس للتكنولوجيا - انظر ملف الترخيص للحصول على التفاصيل
شوكة المستودع
إنشاء فرع ميزة
ارتكب تغييراتك
ادفع إلى الفرع
إنشاء طلب سحب
Software {Evolverl2024 ، title = {Evolverl: التعلم التعزيز التطوري لـ LLMS} ، المؤلف = {thehandsomedev} ، year = {2025} ، url = {https://www.evolverl.com/}}}}