Microsoft-Forscher haben ein neues KI-Framework namens Auto Evol-Instruct veröffentlicht, das Leitdatensätze ohne menschliches Eingreifen automatisch weiterentwickeln kann. Dies ist von großer Bedeutung für die Verbesserung der Fähigkeit großer Sprachmodelle (LLMs), komplexen Anweisungen zu folgen. Traditionelle evolutionäre Methoden basieren auf künstlich entworfenen Regeln, die ineffizient sind und sich nur schwer an neue Aufgaben anpassen lassen. Auto Evol-Instruct hingegen analysiert automatisch Anweisungen durch LLMs, entwirft und optimiert selbstständig Evolutionsregeln, realisiert einen automatisierten und effizienten Evolutionsprozess und verbessert die Komplexität und Vielfalt von Datensätzen erheblich.
Kürzlich haben Microsoft-Forscher ein neues KI-Framework namens Auto Evol-Instruct vorgeschlagen, das automatisch Führungsdatensätze ohne menschliches Eingreifen entwickeln kann.
Im Bereich der künstlichen Intelligenz ist die Entwicklung großer Sprachmodelle (LLMs) von entscheidender Bedeutung, insbesondere um die Fähigkeit dieser Modelle zu verbessern, detaillierten Anweisungen zu folgen. Forscher haben untersucht, wie die zum Training von LLMs verwendeten Datensätze verbessert werden können, um die Leistung und Anpassungsfähigkeit der Modelle zu verbessern.
Herkömmliche Evolutionsmethoden wie Evol-Instruct basieren auf von menschlichen Experten festgelegten Evolutionsregeln, was nicht nur teuer und zeitaufwändig ist, sondern auch eine Neugestaltung der Methode bei der Anpassung an neue Aufgaben erfordert. Im Gegensatz dazu realisiert Auto Evol-Instruct den automatisierten Evolutionsprozess, indem es zunächst LLMs verwendet, um Eingabeanweisungen zu analysieren und unabhängig die anfängliche Methode der Evolutionsregeln zu entwerfen. Anschließend wird die Evolutionsmethode durch Optimierungs-LLMs iterativ optimiert, um Probleme während des Evolutionsprozesses zu identifizieren und zu lösen und so die Komplexität und Stabilität der endgültigen Evolutionsanweisungen sicherzustellen.
Auto Evol-Instruct nutzt LLMs, um Evolutionsmethoden zu entwerfen, indem Eingabeanweisungen automatisch analysiert und Evolutionsregeln formuliert werden, wodurch die Komplexität und Vielfalt von Datensätzen erhöht wird.
Was die Leistungsbewertung angeht, schneidet Auto Evol-Instruct in mehreren Benchmark-Tests gut ab. Durch die Feinabstimmung von Mixtral-8x7B unter Verwendung von nur 10.000 entwickelten ShareGPT-Daten erreichte das Framework beispielsweise 8,09 Punkte auf MT-Bench und 91,4 Punkte auf AlpacaEval, übertraf damit GPT-3.5-Turbo und WizardLM-70B und konkurrierte mit Claude2.0 Äquivalent.
Darüber hinaus erreicht das Framework durch die Verwendung von nur 7K entwickelten GSM8K-Trainingsdaten 82,49 Punkte bei GSM8K. In Bezug auf die Codegenerierung erreicht das Framework durch die Feinabstimmung von DeepSeek-Coder-Base-33B unter Verwendung von 20K entwickelten Code Alpaca eine Punktzahl von 82,49 HumanEval erreichte eine Punktzahl von 77,4 und übertraf damit andere Konkurrenzmodelle.
Es ist ersichtlich, dass dieses neue Framework in mehreren Benchmark-Tests, darunter MT-Bench, AlpacaEval, GSM8K und HumanEval, gut abgeschnitten hat und sein Potenzial zur Verbesserung der Befehlsfolge, des mathematischen Denkens und der Codegenerierungsfähigkeiten unter Beweis gestellt hat.
Papieradresse: https://arxiv.org/abs/2406.00770
Höhepunkte:
Auto Evol-Instruct ist ein vollautomatisches KI-Framework, das Leitdatensätze ohne menschliches Eingreifen automatisch analysieren und weiterentwickeln kann.
Das Framework erhöht effektiv die Komplexität und Vielfalt von Datensätzen durch die Optimierung der Evolutionsmethode und verbessert dadurch die Leistung und Anpassungsfähigkeit von LLMs bei verschiedenen Aufgaben.
Die Ergebnisse von Auto Evol-Instruct zeigen eine Methode zur Steuerung der Entwicklung von Datensätzen durch Automatisierung.
Das Aufkommen des Auto Evol-Instruct-Frameworks stellt eine wichtige Innovation in der Evolutionsmethode von LLMs-Trainingsdaten dar. Seine automatisierten und effizienten Funktionen werden die Entwicklung von LLMs erheblich fördern und den Aufbau leistungsfähigerer und anpassungsfähigerer KI-Modelle stark unterstützen. Es wurden relevante Artikel veröffentlicht, die von interessierten Lesern eingehend studiert werden können.