evolveRL Download - evolveRL Quellcode Download

evolveRL

AI-Quellcode

1.0.0

Herunterladen

Evolverl: Evolutionäres Verstärkungslernen für LLMs

Stärkung wirklich autonomer KI -Agenten durch kontroverse evolutionäre Verstärkungslernen

Links

Webseite
Whitepaper
Techpaper
Dokumente
Telegramm
Twitter/x

Inhaltsverzeichnis

Überblick
Merkmale
Erste Schritte
Installation
Komponenten
Evolutionsschleife
Detaillierte Walkthrough
Lizenz
Beitragen
Zitat

Überblick

Evolverl ist ein bahnbrechender Rahmen, der es KI-Agenten ermöglicht, sich durch evolutionäre und kontroverse Mechanismen selbst zu verbessern. Im Gegensatz zu herkömmlichen Ansätzen, die stark auf manuellem Umfangstechnik angewiesen sind, ermöglicht Evolverl es Agenten, ihre eigenen Eingabeaufforderungen und Konfigurationen systematisch zu generieren, zu testen und zu verfeinern, wodurch die Lücke zwischen theoretischer Autonomie und tatsächlicher Selbstverantwortung überbrückt wird.

Die Herausforderung

In der aufstrebenden AI -Agentenwirtschaft stellen sich viele eine Zukunft vor, in der Agenten autonom mit minimaler menschlicher Beobachtung laufen. Wenn Menschen jedoch die KI -Aufforderungen ständig aktualisieren müssen, um neue Aufgaben oder Kantenfälle zu erledigen, sind die Agenten nicht wirklich souverän. Evolverl löst dies, indem er eine kontinuierliche Selbstverbesserung ermöglicht:

Autonome Evolution : Agenten erkennen Lücken und aktualisieren ihre eigenen Eingabeaufforderungen
Gegentliche Tests : robuste Validierung gegen herausfordernde Szenarien
Leistungsbasierte Auswahl : natürliche Entstehung optimaler Konfigurationen
Kontinuierliche Anpassung : Echtzeitreaktion auf sich ändernde Bedingungen

Merkmale

Evolutionsoptimierung : Entwicklung und Verhaltensweisen mit genetischen Algorithmen entwickeln
Domain Agnostic : Spezialisierung für jede Domäne
Robuste Bewertung : umfassende Beurteilung und Bewertung
Gegentliche Tests : Erzeugen Sie herausfordernde Szenarien, um Robustheit zu gewährleisten
Staatsmanagement : Speichern und laden entwickelte Modelle und ihre Zustände
Mehrfachmodellunterstützung : Verwenden Sie OpenAIs GPT oder Anthropics Claude oder Laufen Sie Lama lokal (bald kommen in Kürze)
Selbstverbesserungsschleife : kontinuierliche Evolution ohne menschliche Intervention

Installation

 # Grundlegende InstallationPip Installation Evolverl# Installieren Sie mit allen Abhängigkeitenspips Evolverl [alle]

Schneller Start

 Aus Evolverl.evolution Import Evolution, EvolutionConFigfrom Evolverl.llm import llmconFigfrom evolverl.agent Import Agent, AgentConfig # Konfigurieren Sie LLM Backendllm_Config = llmconfig (model_name = "gpt-4", model_type = "openai", # oder "aNthropic", "openA_type =" openai ", # oder" aNthropic "," ANTHROPIC "," ANTHROPIC "," ANTHROPIC "," Offene ". -api-key " # oder anthropic_api_key für claude) # Agent mit System promptagent_config = AgentConfig (llm_config = llm_config) Agent = Agent (Agent_Config) Agent Komplexe Probleme Schritt für Schritt und zeigen Sie Ihre Arbeit klar. " (config, experiment_id = "math_solver")# rennen evolution processaawait evolution.evolve (Domain = "Mathematik", Beschreibung = "Komplexe mathematische Probleme mit detaillierten Erklärungen lösen")

Direktagentenverwendung

Sie können Agenten auch direkt ohne Evolution verwenden:

 # Create und konfigurieren agentagent = Agent (AgentConfig (llm_config = llm_config) agent.set_default_prompt ("Sie sind ein hilfreicher AI -Assistent ...")# Senden MessageResponse = Awed Agent.Send_Message ("Was ist 2+2?"). (Antwort)

CLI -Verwendung

train_agent.py ist eine einzelne Datei -CLI, die den Evolutionsprozess ausführt. Stellen Sie sicher, dass Sie zuerst die Konfigurationsdatei default_config.json aktualisieren und Ihre OpenAI- oder Anthropic -API -Schlüssel als Umgebungsvariablen oder im .env behalten.

 # Grundnutzung mit openaipython Train_agent.py -Domain Math -De -Scription "Lösung mathematische Probleme" -V# Verwenden Sie Anthropics Claudepython Train_agent.py -Provider Anthropic -Domain Math -De -Scription "Lösen Sie Mathematikprobleme"# Lastdomäne von Filepython Lastdomäne aus Filepython Train_agent.py-Domain-File-Domänen/Math_Solver.json# Benutzerdefinierte Ausgabe DirectoryPython Train_agent.py-Domain Math--Description "..."-Output-Dir ./my_agents# Erhöhen Verbot (bis zu -vvvv) Python erhöhen Train_agent.py -Domain Math -De -Scription "..." -VVV

Aktuelle Domänenbeispiele sind in der natürlichen Sprache. Sie können weitere Details hinzufügen, wenn Sie Ihre eigenen Anwendungsfälle erstellen. Darüber hinaus können Sie alle Beispiele einfügen, von denen Sie glauben, dass sie für den Agenten wichtig sind.

Ausgangsstruktur

agents/
├── {experiment_id}_gen0.json           # Best agent from generation 0
├── {experiment_id}_gen0_full.json      # All variants and scores from generation 0
├── {experiment_id}_gen1.json           # Best agent from generation 1
├── {experiment_id}_gen1_full.json      # All variants and scores from generation 1
└── {experiment_id}_best.json           # Best agent overall

Die Person .json (nicht der *_full.json ) enthält die AgentConfig für den besten Agenten der Generation oder insgesamt. Sie können einen Agenten direkt aus seiner AgentConfig -Datei initiieren, indem Sie agent.load_config(PATH_TO_CONFIG_FILE) aufrufen. Achten Sie darauf, die API -Taste zu aktualisieren, da sie nicht in der AgentConfig -Datei gespeichert wird.

Erzeugungsausgangsformat

 {"Population_size": 5, "Generationen": 10, "mutation_rate": 0.1, "crossover_rate": 0.8, "min_score_threshold": 0.7, "turnier_size": 2, "max_interaction_attempts": 5, "output_dir": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": "Agents": , "llm_config": {"model_name": "gpt-4o-mini", "model_type": "openai", "max_tokens": 500, "Temperatur": 0.7}
}

Ausgangsstruktur

agents/
├── {experiment_id}_gen0.json           # Best agent from generation 0
├── {experiment_id}_gen0_full.json      # All variants from generation 0
├── {experiment_id}_gen1.json           # Best agent from generation 1
├── {experiment_id}_gen1_full.json      # All variants from generation 1
└── {experiment_id}_best.json           # Best agent overall

Fortschrittsverfolgung

Der Evolutionsprozess zeigt Echtzeit-Fortschritte mit verschachtelten Fortschrittsbalken:

Generation 2/10: 100%|██████████| 6/6 [00:15<00:00, best_score=0875, avg_score=0834]
Overall Progress:  15%|██        | 12/80 [00:30<02:45, generation=2/10, best_overall=0875]

Dies kann eine Weile dauern, abhängig von der Anzahl der Generationen und der Bevölkerungsgröße pro Generation.

Lizenz

MIT -Lizenz - Einzelheiten finden Sie in Lizenzdatei

Beitragen

Geben Sie das Repository auf
Erstellen Sie einen Feature -Zweig
Verpflichten Sie Ihre Änderungen
In den Zweig drücken
Erstellen Sie eine Pull -Anfrage

Zitat

 @software {evolverl2024, title = {evolverl: evolutionäres Verstärkungslernen für LLMs}, Author = {theHandSomedev}, Jahr = {2025}, url = {https://www.evolverl.com/}}}

Expandieren

Zusätzliche Informationen