Stärkung wirklich autonomer KI -Agenten durch kontroverse evolutionäre Verstärkungslernen
Webseite
Whitepaper
Techpaper
Dokumente
Telegramm
Twitter/x
Überblick
Merkmale
Erste Schritte
Installation
Komponenten
Evolutionsschleife
Detaillierte Walkthrough
Lizenz
Beitragen
Zitat
Evolverl ist ein bahnbrechender Rahmen, der es KI-Agenten ermöglicht, sich durch evolutionäre und kontroverse Mechanismen selbst zu verbessern. Im Gegensatz zu herkömmlichen Ansätzen, die stark auf manuellem Umfangstechnik angewiesen sind, ermöglicht Evolverl es Agenten, ihre eigenen Eingabeaufforderungen und Konfigurationen systematisch zu generieren, zu testen und zu verfeinern, wodurch die Lücke zwischen theoretischer Autonomie und tatsächlicher Selbstverantwortung überbrückt wird.
In der aufstrebenden AI -Agentenwirtschaft stellen sich viele eine Zukunft vor, in der Agenten autonom mit minimaler menschlicher Beobachtung laufen. Wenn Menschen jedoch die KI -Aufforderungen ständig aktualisieren müssen, um neue Aufgaben oder Kantenfälle zu erledigen, sind die Agenten nicht wirklich souverän. Evolverl löst dies, indem er eine kontinuierliche Selbstverbesserung ermöglicht:
Autonome Evolution : Agenten erkennen Lücken und aktualisieren ihre eigenen Eingabeaufforderungen
Gegentliche Tests : robuste Validierung gegen herausfordernde Szenarien
Leistungsbasierte Auswahl : natürliche Entstehung optimaler Konfigurationen
Kontinuierliche Anpassung : Echtzeitreaktion auf sich ändernde Bedingungen
Evolutionsoptimierung : Entwicklung und Verhaltensweisen mit genetischen Algorithmen entwickeln
Domain Agnostic : Spezialisierung für jede Domäne
Robuste Bewertung : umfassende Beurteilung und Bewertung
Gegentliche Tests : Erzeugen Sie herausfordernde Szenarien, um Robustheit zu gewährleisten
Staatsmanagement : Speichern und laden entwickelte Modelle und ihre Zustände
Mehrfachmodellunterstützung : Verwenden Sie OpenAIs GPT oder Anthropics Claude oder Laufen Sie Lama lokal (bald kommen in Kürze)
Selbstverbesserungsschleife : kontinuierliche Evolution ohne menschliche Intervention
# Grundlegende InstallationPip Installation Evolverl# Installieren Sie mit allen Abhängigkeitenspips Evolverl [alle]
Aus Evolverl.evolution Import Evolution, EvolutionConFigfrom Evolverl.llm import llmconFigfrom evolverl.agent Import Agent, AgentConfig # Konfigurieren Sie LLM Backendllm_Config = llmconfig (model_name = "gpt-4", model_type = "openai", # oder "aNthropic", "openA_type =" openai ", # oder" aNthropic "," ANTHROPIC "," ANTHROPIC "," ANTHROPIC "," Offene ". -api-key " # oder anthropic_api_key für claude) # Agent mit System promptagent_config = AgentConfig (llm_config = llm_config) Agent = Agent (Agent_Config) Agent Komplexe Probleme Schritt für Schritt und zeigen Sie Ihre Arbeit klar. " (config, experiment_id = "math_solver")# rennen evolution processaawait evolution.evolve (Domain = "Mathematik", Beschreibung = "Komplexe mathematische Probleme mit detaillierten Erklärungen lösen")
Sie können Agenten auch direkt ohne Evolution verwenden:
# Create und konfigurieren agentagent = Agent (AgentConfig (llm_config = llm_config) agent.set_default_prompt ("Sie sind ein hilfreicher AI -Assistent ...")# Senden MessageResponse = Awed Agent.Send_Message ("Was ist 2+2?"). (Antwort)
train_agent.py
ist eine einzelne Datei -CLI, die den Evolutionsprozess ausführt. Stellen Sie sicher, dass Sie zuerst die Konfigurationsdatei default_config.json
aktualisieren und Ihre OpenAI- oder Anthropic -API -Schlüssel als Umgebungsvariablen oder im .env
behalten.
# Grundnutzung mit openaipython Train_agent.py -Domain Math -De -Scription "Lösung mathematische Probleme" -V# Verwenden Sie Anthropics Claudepython Train_agent.py -Provider Anthropic -Domain Math -De -Scription "Lösen Sie Mathematikprobleme"# Lastdomäne von Filepython Lastdomäne aus Filepython Train_agent.py-Domain-File-Domänen/Math_Solver.json# Benutzerdefinierte Ausgabe DirectoryPython Train_agent.py-Domain Math--Description "..."-Output-Dir ./my_agents# Erhöhen Verbot (bis zu -vvvv) Python erhöhen Train_agent.py -Domain Math -De -Scription "..." -VVV
Aktuelle Domänenbeispiele sind in der natürlichen Sprache. Sie können weitere Details hinzufügen, wenn Sie Ihre eigenen Anwendungsfälle erstellen. Darüber hinaus können Sie alle Beispiele einfügen, von denen Sie glauben, dass sie für den Agenten wichtig sind.
agents/ ├── {experiment_id}_gen0.json # Best agent from generation 0 ├── {experiment_id}_gen0_full.json # All variants and scores from generation 0 ├── {experiment_id}_gen1.json # Best agent from generation 1 ├── {experiment_id}_gen1_full.json # All variants and scores from generation 1 └── {experiment_id}_best.json # Best agent overall
Die Person .json
(nicht der *_full.json
) enthält die AgentConfig
für den besten Agenten der Generation oder insgesamt. Sie können einen Agenten direkt aus seiner AgentConfig
-Datei initiieren, indem Sie agent.load_config(PATH_TO_CONFIG_FILE)
aufrufen. Achten Sie darauf, die API -Taste zu aktualisieren, da sie nicht in der AgentConfig
-Datei gespeichert wird.
{"Population_size": 5, "Generationen": 10, "mutation_rate": 0.1, "crossover_rate": 0.8, "min_score_threshold": 0.7, "turnier_size": 2, "max_interaction_attempts": 5, "output_dir": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": , "llm_config": {"model_name": "gpt-4o-mini", "model_type": "openai", "max_tokens": 500, "Temperatur": 0.7} }
agents/ ├── {experiment_id}_gen0.json # Best agent from generation 0 ├── {experiment_id}_gen0_full.json # All variants from generation 0 ├── {experiment_id}_gen1.json # Best agent from generation 1 ├── {experiment_id}_gen1_full.json # All variants from generation 1 └── {experiment_id}_best.json # Best agent overall
Der Evolutionsprozess zeigt Echtzeit-Fortschritte mit verschachtelten Fortschrittsbalken:
Generation 2/10: 100%|██████████| 6/6 [00:15<00:00, best_score=0875, avg_score=0834] Overall Progress: 15%|██ | 12/80 [00:30<02:45, generation=2/10, best_overall=0875]
Dies kann eine Weile dauern, abhängig von der Anzahl der Generationen und der Bevölkerungsgröße pro Generation.
MIT -Lizenz - Einzelheiten finden Sie in Lizenzdatei
Geben Sie das Repository auf
Erstellen Sie einen Feature -Zweig
Verpflichten Sie Ihre Änderungen
In den Zweig drücken
Erstellen Sie eine Pull -Anfrage
@software {evolverl2024, title = {evolverl: evolutionäres Verstärkungslernen für LLMs}, Author = {theHandSomedev}, Jahr = {2025}, url = {https://www.evolverl.com/}}}