Cognition a lancé l'incroyable programmeur d'IA Genie, qui a battu Devin et GPT-4 avec un score de 30,08 % sur la plateforme de test faisant autorité SWE-Bench, devenant ainsi l'assistant de programmation d'IA le plus puissant au monde. L'éditeur de Downcodes vous donnera une compréhension approfondie des avancées technologiques et des perspectives d'avenir derrière Genie.
La startup d'IA Cognition a lancé un nouveau programmeur d'IA "Genie". Ses performances sont étonnantes. Il a instantanément vaincu Devin et GPT-4 et est devenu l'assistant de programmation d'IA le plus puissant au monde.
Ce programmeur d'IA a obtenu un score allant jusqu'à 30,08 % sur la plateforme de test faisant autorité SWE-Bench, dépassant de loin les 13,8 % de Devin et les 12,47 % de Swe-agent+GPT-4.
Vous vous demandez peut-être comment Genie fait-il ? Dès décembre 2022, le co-fondateur de Genie, Alistair Pullen, a présenté ce projet à l'Université de Londres. Il espère créer un programme d’IA capable de coder, déboguer et optimiser automatiquement comme les humains. Après plus d'un an de développement, Genie est finalement entré dans la phase de test et a reçu 2,5 millions de dollars américains en financement de démarrage.
Alistair a mentionné que le succès de Genie est étroitement lié à ses données et méthodes de formation. Contrairement au réglage fin traditionnel des grands modèles, Genie utilise un ensemble de données spécial qui intègre le processus de raisonnement des programmeurs humains. Les données couvrent la découverte étape par étape des connaissances et le processus de prise de décision basé sur des cas, permettant à Genie de faire preuve d'un jugement similaire à celui d'un ingénieur humain face à des problèmes complexes.
De plus, Genie utilise également un « mécanisme d'auto-amélioration » unique. Initialement, Genie s'est entraîné sur des données de haute qualité et a atteint un état « parfait », mais au cours du processus, Genie n'a pas réussi à juger ses propres erreurs et n'a pas réussi à s'améliorer. Afin de surmonter ce problème, les développeurs ont utilisé Genie pour générer des données synthétiques afin d'enrichir davantage le contenu de la formation. C'est comme une mère qui apprend à son enfant à marcher et lui donne les bons conseils après chaque chute.
Après de nombreuses itérations de formation, les capacités de Génie se sont grandement améliorées et il peut même montrer des solutions créatives à des problèmes invisibles. Sur le plan fonctionnel, Genie prend en charge une variété de tâches de développement, notamment le développement de fonctions, la réparation de BUG, la refactorisation de code, les tests de code, etc., couvrant des dizaines de langages de programmation tels que JavaScript, Python et Java.
Désormais, Genie a ouvert des applications pour une utilisation à l'essai. Vous pouvez vous inscrire via le site officiel. Les autorisations de test devraient être délivrées dans les prochaines semaines.
Blog officiel : https://cosine.sh/blog/state-of-the-art
Adresse de l'expérience : https://cosine.sh/register
Souligner:
Genie a obtenu un score allant jusqu'à 30,08 % au test SWE-Bench, devenant ainsi le programmeur d'IA le plus puissant au monde.
Grâce à des ensembles de données spéciaux et à des mécanismes d'auto-amélioration, Genie excelle dans le codage complexe.
? La demande d'essai est actuellement ouverte et d'autres fonctionnalités surprises seront lancées à l'avenir !
L'émergence de Genie marque une nouvelle percée dans le domaine des assistants de programmation d'IA. Sa méthode de formation unique et son mécanisme d'auto-amélioration méritent l'attention de l'industrie. L'éditeur de Downcodes attend avec impatience que Genie apporte encore plus de surprises aux développeurs à l'avenir !