Récemment, OpenAI a publié un rapport de recherche sur son dernier modèle d'inférence O3, montrant les progrès significatifs des modèles de grande langue (LLM) dans le domaine de la programmation. Le modèle O3 a obtenu un score élevé de 2724 sur la célèbre plate-forme de programmation CodeForces, se classant dans les 99,8% du monde, et s'est très bien comporté. En outre, le modèle a remporté un niveau de médaille d'or dans les Jeux olympiques internationaux de l'information (IOI) en 2024, marquant sa capacité exceptionnelle dans la compétition de programmation.
Remarques de la source d'image: L'image est générée par l'IA, et le fournisseur de services autorisé l'image MidJourney
La recherche montre que le modèle O3 fonctionne dans les compétitions IOI au-delà du modèle O1-IOI spécialement affiné pour l'événement. Ce résultat révèle l'énorme potentiel d'apprentissage par renforcement dans le domaine de la programmation, ce qui suggère que les modèles généraux formés par l'apprentissage du renforcement peuvent aller au-delà des solutions spécifiques au domaine pour la conception à main. Dans l'événement IOI 2024, O3 a réussi le seuil de médaille d'or dans des conditions standard, et en même temps classé parmi les 200 programmateurs les plus élevés au monde sur la plate-forme Codeforces, démontrant sa force pour rivaliser avec les meilleurs programmeurs humains.
Ethan Mollick, professeur agrégé à Wharton, a déclaré: «Les capacités de raisonnement universelles développées grâce à l'apprentissage du renforcement sont allées au-delà des solutions bien conçues du domaine. La capacité permet aux grands modèles généraux d'obtenir de meilleurs résultats.
Cette étude fait partie de l'évaluation par OpenAI des performances de son modèle dans la programmation compétitive et le domaine du génie logiciel plus large. Pendant ce temps, une autre société d'IA, Anthropic, a également publié un rapport sur l'impact de l'IA sur le lieu de travail ce lundi. Le rapport note qu'environ 36% des professions utilisent l'IA dans au moins 25% des tâches de travail, tandis que 57% des applications d'IA améliorent les capacités humaines et 43% se concentrent sur l'automatisation. Néanmoins, seulement 4% des professions, l'IA est utilisée pour au moins 75% des tâches de travail, indiquant qu'il y a encore beaucoup de place pour le développement pour l'application de l'IA sur le lieu de travail.
Le rapport souligne également que le développement logiciel et la rédaction technique sont les principaux domaines des applications d'IA et que l'IA a un rôle relativement faible dans les tâches impliquant une interaction physique avec l'environnement. Cette découverte révèle les différences d'application de l'IA dans différents domaines et fournit également une orientation pour le développement technologique futur.
En résumé, l'excellente performance du modèle O3 dans lesforces de code et IOI montre le fort potentiel de l'apprentissage du renforcement dans le domaine de la programmation. Dans le même temps, l'utilisation généralisée de l'IA sur le lieu de travail, en particulier ses performances exceptionnelles dans les domaines du développement logiciel et de l'écriture technique, indique que la technologie de l'IA continuera de promouvoir les changements dans tous les domaines de la vie à l'avenir.