Recientemente, Openai publicó un informe de investigación sobre su último modelo de inferencia O3, que muestra el avance significativo de los grandes modelos de lenguaje (LLM) en el campo de la programación. El modelo O3 logró una puntuación alta de 2724 en la famosa plataforma de programación CodeForces, clasificando en el 99.8% superior del mundo y funcionó extremadamente bien. Además, el modelo ganó un nivel de medalla de oro en los Juegos Olímpicos Internacionales de Informática de 2024 (IOI), marcando su habilidad sobresaliente en la competencia de programación.
Notas de fuente de imagen: La imagen es generada por AI y el proveedor de servicios autorizado de imagen MidJourney
La investigación muestra que el modelo O3 funciona en competiciones IOI más allá del modelo O1-IOI especialmente ajustado para el evento. Este resultado revela el enorme potencial del aprendizaje de refuerzo en el campo de la programación, lo que sugiere que los modelos generales entrenados a través del aprendizaje de refuerzo pueden ir más allá de las soluciones específicas de dominio para el diseño manual. En el evento IOI 2024, O3 cruzó con éxito el umbral de la medalla de oro en condiciones estándar, y al mismo tiempo se clasificó entre los 200 principales programadores del mundo en la plataforma CodeForces, demostrando su fuerza para competir con los mejores programadores humanos.
Ethan Mollick, profesor asociado en Wharton, dijo: “Las capacidades de razonamiento universal desarrolladas a través del aprendizaje de refuerzo han ido más allá de las soluciones bien diseñadas específicas de dominio. La capacidad permite que los grandes modelos generales logren mejores resultados.
Este estudio es parte de la evaluación de OpenAI del rendimiento de su modelo en programación competitiva y el campo de ingeniería de software más amplio. Mientras tanto, otra compañía de IA, Anthrope, también publicó un informe sobre el impacto de la IA en el lugar de trabajo este lunes. El informe señala que aproximadamente el 36% de las ocupaciones usan IA en al menos el 25% de las tareas de trabajo, mientras que el 57% de las aplicaciones de IA mejoran las capacidades humanas y el 43% se centra en la automatización. Sin embargo, solo el 4% de las ocupaciones, la IA se usa para al menos el 75% de las tareas de trabajo, lo que indica que todavía hay mucho espacio para el desarrollo para la aplicación de IA en el lugar de trabajo.
El informe también señala que el desarrollo de software y la escritura técnica son las áreas principales de las aplicaciones de IA, y que la IA tiene un papel relativamente pequeño en las tareas que involucran la interacción física con el medio ambiente. Este descubrimiento revela las diferencias en la aplicación de IA en diferentes campos, y también proporciona dirección para el desarrollo tecnológico futuro.
En resumen, el excelente rendimiento del modelo O3 en CodeForcs e IOI demuestra el fuerte potencial de aprendizaje de refuerzo en el campo de la programación. Al mismo tiempo, el uso generalizado de la IA en el lugar de trabajo, especialmente su excelente rendimiento en los campos del desarrollo de software y la escritura técnica, indica que la tecnología de IA continuará promoviendo los cambios en todos los ámbitos de la vida en el futuro.