تنزيل evolveRL - تنزيل رمز المصدر evolveRL

evolveRL

كود الذكاء الاصطناعي

1.0.0

تنزيل

Evolverl: التعلم التعزيز التطوري لـ LLMS

تمكين عملاء الذكاء الاصطناعى الذاتي الذاتي من خلال تعلم التعزيز التطوري العدائي

الروابط

موقع إلكتروني
ورقة بيضاء
الورقة الفنية
مستندات
برقية
Twitter/X.

جدول المحتويات

ملخص
سمات
ابدء
تثبيت
عناصر
حلقة تطورية
تجول مفصل
رخصة
المساهمة
اقتباس

ملخص

Evolverl هو إطار رائد يمكّن عملاء الذكاء الاصطناعى من التنفيذ الذاتي من خلال الآليات التطورية والعدوانية. على عكس الأساليب التقليدية التي تعتمد اعتمادًا كبيرًا على الهندسة المذهلة اليدوية ، يسمح Evolverl للوكلاء بإنشاء واختبار ومطالباتهم بشكل منهجي ، وسد الفجوة بين الحكم الذاتي النظري والاعتماد الفعلي على الذات.

التحدي

في اقتصاد وكيل الذكاء الاصطناعى الناشئ ، يتصور الكثيرون مستقبلًا حيث يعمل الوكلاء بشكل مستقل مع الحد الأدنى من الرقابة البشرية. ومع ذلك ، إذا كان على البشر أن يقوموا باستمرار بتحديث مطالبات الذكاء الاصطناعي للتعامل مع المهام الجديدة أو حالات الحافة ، فإن الوكلاء ليسوا سياديًا حقًا. يحل Evolverl هذا عن طريق تمكين التحسين الذاتي المستمر من خلال:

التطور المستقل : يكتشف الوكلاء الفجوات ويحدثون مطالباتهم الخاصة
اختبار الخصومة : التحقق القوي ضد السيناريوهات الصعبة
الاختيار القائم على الأداء : ظهور طبيعي للتكوينات المثلى
التكيف المستمر : الاستجابة في الوقت الفعلي للظروف المتغيرة

سمات

التحسين التطوري : تطور المطالبات والسلوكيات باستخدام الخوارزميات الجينية
المجال اللاأدري : التخصص لأي مجال
تقييم قوي : الحكم والتقييم الشامل
اختبار الخصومة : توليد سيناريوهات صعبة لضمان المتانة
إدارة الدولة : حفظ وتحميل النماذج المتطورة وحالاتهم
دعم النماذج المتعددة : استخدم GPT من Openai أو كلودس ، أو تشغيل Llama محليًا (قريبًا)
حلقة تحسين الذات : تطور مستمر بدون تدخل بشري

تثبيت

 # التثبيت الأساسي تثبيت Evolverl# تثبيت مع جميع التبعية تثبيت Evolverl [all]

بداية سريعة

 من Evolverl.Evolution Import Evolution ، EvolutionConfigfromfrom Evolverl.llm Import LlmConfigfrom. -APi-key " # أو shinhOthS_API_KEY لـ CLAUDE) المشكلات المعقدة خطوة بخطوة وإظهار عملك بوضوح. "" "") (config ، experience_id = "math_solver")# قم بتشغيل التطور التطور.

استخدام الوكيل المباشر

يمكنك أيضًا استخدام الوكلاء مباشرة دون تطور:

 # إنشاء وتكوين AgentAgent = Agent (AgentConfig (llm_config = llm_config)) Agent.set_default_prompt ("أنت مساعد مفيد AI ...") (إجابة)

استخدام CLI

train_agent.py هو ملف واحد CLI يقوم بتشغيل عملية التطور. تأكد من تحديث ملف config default_config.json أولاً ، وكذلك الحفاظ على مفتاح Openai أو Anthropic API كمتغيرات بيئة أو في .env .

 # الاستخدام الأساسي مع OpenAipython Train_agent.py -المجال الرياضيات -الوصف "حل مشاكل الرياضيات" -v# استخدم أنثروبريت كلوبيثون تورون_جنت. TRAIN_AGENT.PY-مجالات-دومين/MATH_SOLVER.JSON# مخصص الإخراج DIRECTORYTHON TRAIN_AGENT.PY-DOMAIN MATH-DESCRIPTION "..."-output-dir. Train_agent.py -Math -Domain -Description "..." -vvv

أمثلة المجال الحالية في اللغة الطبيعية. يمكنك إضافة المزيد من التفاصيل عند إنشاء حالات الاستخدام الخاصة بك. بالإضافة إلى ذلك ، يمكنك تضمين أي أمثلة تعتقد أنها مهمة للوكيل لمعرفة.

هيكل الإخراج

agents/
├── {experiment_id}_gen0.json           # Best agent from generation 0
├── {experiment_id}_gen0_full.json      # All variants and scores from generation 0
├── {experiment_id}_gen1.json           # Best agent from generation 1
├── {experiment_id}_gen1_full.json      # All variants and scores from generation 1
└── {experiment_id}_best.json           # Best agent overall

يحتوي الفرد .json (وليس *_full.json ) على AgentConfig لأفضل وكيل للجيل أو بشكل عام. يمكنك بدء وكيل مباشرة من ملف AgentConfig الخاص به عن طريق الاتصال agent.load_config(PATH_TO_CONFIG_FILE) . تأكد من تحديث مفتاح API لأنه لن يتم تخزينه في ملف AgentConfig .

تنسيق إخراج الجيل

 {"compan_size": 5 ، "الأجيال": 10 ، "mutation_rate": 0.1 ، "Crossover_rate": 0.8 ، "min_score_threshold": 0.7 ، "tournament_size": 2 ، "max_interaction_attemps": 5 ، "Output_dir": "agents" ، "llm_config": {"model_name": "gpt-4o-mini" ، "model_type": "openai" ، "max_tokens": 500 ، "درجة الحرارة": 0.7}
}

هيكل الإخراج

agents/
├── {experiment_id}_gen0.json           # Best agent from generation 0
├── {experiment_id}_gen0_full.json      # All variants from generation 0
├── {experiment_id}_gen1.json           # Best agent from generation 1
├── {experiment_id}_gen1_full.json      # All variants from generation 1
└── {experiment_id}_best.json           # Best agent overall

تتبع التقدم

تُظهر عملية التطور تقدمًا في الوقت الفعلي مع أشرطة التقدم المتداخلة:

Generation 2/10: 100%|██████████| 6/6 [00:15<00:00, best_score=0875, avg_score=0834]
Overall Progress:  15%|██        | 12/80 [00:30<02:45, generation=2/10, best_overall=0875]

قد يستغرق هذا بعض الوقت اعتمادًا على عدد الأجيال وحجم السكان لكل جيل.

رخصة

ترخيص معهد ماساتشوستس للتكنولوجيا - انظر ملف الترخيص للحصول على التفاصيل

المساهمة

شوكة المستودع
إنشاء فرع ميزة
ارتكب تغييراتك
ادفع إلى الفرع
إنشاء طلب سحب

اقتباس

 Software {Evolverl2024 ، title = {Evolverl: التعلم التعزيز التطوري لـ LLMS} ، المؤلف = {thehandsomedev} ، year = {2025} ، url = {https://www.evolverl.com/}}}}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-02-14
الحجم 4.95MB
من Github

تطبيقات ذات صلة

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
node telegram bot api

كود الذكاء الاصطناعي

v0.50.0
typebot.io

كود الذكاء الاصطناعي

v3.1.2
python wechaty getting started

كود الذكاء الاصطناعي

1.0.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل