Después de un evento de transmisión en vivo para compartir tecnología de 12 días, OpenAI lanzó el modelo de inferencia o3 de próxima generación, así como una versión simplificada de o3-mini optimizada para tareas específicas. o3 ha logrado grandes avances en múltiples pruebas de referencia, su rendimiento supera significativamente al modelo o1 de la generación anterior e incluso se acerca al nivel de inteligencia artificial general (AGI) en algunos aspectos. Este lanzamiento ha atraído una amplia atención en la industria y se cree que tendrá un profundo impacto en los futuros métodos de programación y modelos de trabajo de los programadores.
Después de 12 días de transmisión en vivo de intercambio de tecnología, OpenAI lanzó su modelo de inferencia o3 de próxima generación el último día, que es una versión mejorada del modelo de inferencia o1 lanzado anteriormente. La serie de modelos o3 incluye dos versiones: o3 y o3-mini, de las cuales o3-mini es un modelo más pequeño y aerodinámico, ajustado para tareas específicas. OpenAI afirmó que el modelo o3 puede acercarse a lograr inteligencia artificial general (AGI) bajo ciertas condiciones, es decir, inteligencia artificial que puede completar cualquier tarea que los humanos puedan completar.
En el punto de referencia de inferencia lógica gráfica ARC-AGI, el modelo o3 alcanzó puntuaciones récord, con una puntuación del 75,7 % en el escenario de baja computación, mientras que en la prueba de alta computación alcanzó el 87,5 %, superando el punto de referencia que marca alcanzar niveles humanos. Umbral 85%. En comparación, el modelo o1 obtiene solo entre 25% y 32%, y o3 tiene un rendimiento casi tres veces mejor que o1. En la mundialmente famosa plataforma de competencia de codificación Codeforces, o3 obtuvo una puntuación de 2727, mientras que o1 obtuvo sólo 1891.
Fu Sheng, presidente de Cheetah Mobile u Orion Star, dijo que el lanzamiento de OpenAI o3 presagia la llegada de una era en la que todos los programadores no necesitan dominar el lenguaje Python o C para escribir programas. Los requisitos presentados y el gran modelo de predicción pueden ayudar a completar el trabajo de programación. Fu Sheng cree que el lanzamiento de o3 marca que la capacidad de programación de modelos de lenguajes grandes supera al 99,9% de los programadores. En la competencia de programación de clase mundial Codeforces, o3 logró el resultado más alto del puesto 175, mientras que o1 solo derrotó a más del 90% de los programadores. Programadores. Programadores, GPT-4o solo derrotó al 11% de los programadores antes.
OpenAI planea lanzar oficialmente el modelo o3 a finales de enero del próximo año. Fu Sheng señaló que, aunque los programadores no desaparecerán por completo, su trabajo se centrará más en comprender las necesidades de los usuarios y construir una lógica amplia, y la IA completará en gran medida el trabajo de convertir las necesidades en código. Este lanzamiento presagia una aplicación más amplia de la IA en el campo de la programación y también puede cambiar la forma en que trabajan los programadores.
El lanzamiento del modelo o3 marca un progreso significativo en la tecnología de inteligencia artificial y sus poderosas capacidades de razonamiento y programación tendrán un profundo impacto en varios campos. En el futuro, con el continuo desarrollo y mejora de la tecnología, podemos esperar que la inteligencia artificial desempeñe un papel más importante en más campos y brinde mayor comodidad a la sociedad humana.