Cognition brachte den erstaunlichen KI-Programmierer Genie auf den Markt, der Devin und GPT-4 mit einem Ergebnis von 30,08 % auf der maßgeblichen Testplattform SWE-Bench schlug und zum weltweit stärksten KI-Programmierassistenten wurde. Der Herausgeber von Downcodes vermittelt Ihnen einen detaillierten Einblick in die technologischen Durchbrüche und Zukunftsaussichten hinter Genie.
Das KI-Startup Cognition hat einen neuen KI-Programmierer „Genie“ auf den Markt gebracht. Seine Leistung ist erstaunlich. Er besiegte Devin und GPT-4 und wurde zum leistungsstärksten KI-Programmierassistenten der Welt.
Dieser KI-Programmierer erzielte auf der maßgeblichen Testplattform SWE-Bench eine Punktzahl von bis zu 30,08 % und übertraf damit die 13,8 % von Devin und die 12,47 % von Swe-agent+GPT-4 bei weitem.
Sie fragen sich vielleicht: Wie macht Genie das? Bereits im Dezember 2022 demonstrierte Genie-Mitbegründer Alistair Pullen dieses Projekt an der University of London. Er hofft, ein KI-Programm zu entwickeln, das wie Menschen automatisch programmieren, debuggen und optimieren kann. Nach mehr als einem Jahr Entwicklungszeit trat Genie schließlich in die Testphase ein und erhielt eine Startfinanzierung in Höhe von 2,5 Millionen US-Dollar.
Alistair erwähnte, dass der Erfolg von Genie eng mit seinen Trainingsdaten und -methoden zusammenhängt. Im Gegensatz zur herkömmlichen Feinabstimmung großer Modelle verwendet Genie einen speziellen Datensatz, der den Denkprozess menschlicher Programmierer berücksichtigt. Die Daten decken die schrittweise Wissensgewinnung und den fallbasierten Entscheidungsprozess ab und ermöglichen es Genie, bei komplexen Problemen ein Urteilsvermögen zu zeigen, das dem eines menschlichen Ingenieurs ähnelt.
Darüber hinaus nutzt Genie auch einen einzigartigen „Selbstverbesserungsmechanismus“. Anfangs trainierte Genie auf der Grundlage hochwertiger Daten und erreichte einen „perfekten“ Zustand, doch im Laufe des Prozesses versäumte Genie, seine eigenen Fehler zu beurteilen und konnte sich nicht verbessern. Um dieses Problem zu lösen, nutzten Entwickler Genie, um einige synthetische Daten zu generieren, um den Trainingsinhalt weiter zu bereichern. Das ist so, als würde eine Mutter ihrem Kind das Laufen beibringen und ihm nach jedem Sturz die richtige Anleitung geben.
Nach vielen Trainingsdurchgängen haben sich Genies Fähigkeiten erheblich verbessert und er kann sogar kreative Lösungen für unsichtbare Probleme aufzeigen. Funktionell unterstützt Genie eine Vielzahl von Entwicklungsaufgaben, darunter Funktionsentwicklung, BUG-Reparatur, Code-Refactoring, Code-Tests usw., und deckt Dutzende Programmiersprachen wie JavaScript, Python und Java ab.
Jetzt hat Genie Anträge für die Testnutzung gestellt. Sie können sich über die offizielle Website registrieren. Die Testgenehmigungen werden voraussichtlich in den nächsten Wochen erteilt.
Offizieller Blog: https://cosine.sh/blog/state-of-the-art
Erlebnisadresse: https://cosine.sh/register
Highlight:
Genie erzielte im SWE-Bench-Test sogar 30,08 % und wurde damit zum weltweit stärksten KI-Programmierer.
Durch den Einsatz spezieller Datensätze und Mechanismen zur Selbstverbesserung zeichnet sich Genie durch komplexe Codierung aus.
? Der Antrag auf Testversion ist derzeit geöffnet und in Zukunft werden weitere Überraschungsfunktionen eingeführt!
Das Aufkommen von Genie markiert einen neuen Durchbruch auf dem Gebiet der KI-Programmierassistenten. Seine einzigartige Trainingsmethode und sein Selbstverbesserungsmechanismus verdienen die Aufmerksamkeit der Branche. Der Herausgeber von Downcodes freut sich darauf, dass Genie den Entwicklern in Zukunft weitere Überraschungen bereiten wird!