Cognition lanzó el increíble programador de IA Genie, que venció a Devin y GPT-4 con una puntuación del 30,08% en la plataforma de pruebas autorizada SWE-Bench, convirtiéndose en el asistente de programación de IA más fuerte del mundo. El editor de Downcodes le brindará una comprensión profunda de los avances tecnológicos y las perspectivas futuras detrás de Genie.
La startup de IA Cognition lanzó un nuevo programador de IA, "Genie". Su rendimiento es asombroso. Derrotó instantáneamente a Devin y GPT-4 y se convirtió en el asistente de programación de IA más poderoso del mundo.
Este programador de IA obtuvo una puntuación de hasta el 30,08 % en la plataforma de pruebas autorizada SWE-Bench, superando con creces el 13,8 % de Devin y el 12,47 % de Swe-agent+GPT-4.
Quizás se pregunte cómo lo hace Genie. Ya en diciembre de 2022, el cofundador de Genie, Alistair Pullen, demostró este proyecto en la Universidad de Londres. Espera crear un programa de inteligencia artificial que pueda codificar, depurar y optimizar automáticamente como los humanos. Después de más de un año de desarrollo, Genie finalmente entró en la etapa de prueba y recibió 2,5 millones de dólares en financiación inicial.
Alistair mencionó que el éxito de Genie está estrechamente relacionado con sus datos y métodos de entrenamiento. A diferencia del ajuste tradicional de modelos grandes, Genie utiliza un conjunto de datos especial que incorpora el proceso de razonamiento de programadores humanos. Los datos cubren el descubrimiento paso a paso de conocimiento y el proceso de toma de decisiones basado en casos, lo que permite a Genie demostrar un juicio similar al de un ingeniero humano cuando se enfrenta a problemas complejos.
Además, Genie también utiliza un "mecanismo de superación personal" único. Inicialmente, Genie se entrenó con datos de alta calidad y alcanzó un estado "perfecto", pero en el proceso, Genie no pudo juzgar sus propios errores y no pudo mejorar. Para superar este problema, los desarrolladores utilizaron Genie para generar algunos datos sintéticos para enriquecer aún más el contenido de la capacitación. Es como una madre que le enseña a su hijo a caminar y le da la orientación adecuada después de cada caída.
Después de muchas iteraciones de entrenamiento, las habilidades de Genie han mejorado enormemente e incluso puede mostrar soluciones creativas a problemas invisibles. Funcionalmente, Genie admite una variedad de tareas de desarrollo, incluido el desarrollo de funciones, reparación de ERRORES, refactorización de código, pruebas de código, etc., cubriendo docenas de lenguajes de programación como JavaScript, Python y Java.
Ahora, Genie ha abierto aplicaciones para uso de prueba. Puede registrarse a través del sitio web oficial. Se espera que los permisos de prueba se emitan en las próximas semanas.
Blog oficial: https://cosine.sh/blog/state-of-the-art
Dirección de la experiencia: https://cosine.sh/register
Destacar:
Genie obtuvo una puntuación de hasta el 30,08 % en la prueba SWE-Bench, convirtiéndose en el programador de IA más fuerte del mundo.
Utilizando conjuntos de datos especiales y mecanismos de superación personal, Genie sobresale en codificación compleja.
? ¡La solicitud de prueba está actualmente abierta y se lanzarán más funciones sorpresa en el futuro!
La aparición de Genie marca un nuevo avance en el campo de los asistentes de programación de IA. Su método de formación único y su mecanismo de superación personal merecen la atención de la industria. ¡El editor de Downcodes espera que Genie traiga más sorpresas a los desarrolladores en el futuro!