Le dernier modèle d’IA d’OpenAI « o1-preview » (anciennement nommé « Strawberry ») a suscité des discussions animées. OpenAI a affirmé que ses capacités étaient aussi bonnes que celles d'un doctorant, mais lors des tests réels, elle a montré des erreurs décevantes. L'éditeur de Downcodes vous amènera à avoir une compréhension approfondie de ce modèle d'IA très attendu mais problématique pour voir quel niveau il a atteint et les vrais retours des utilisateurs.
Récemment, OpenAI a lancé le très attendu modèle d'IA, précédemment nommé « Strawberry » et officiellement nommé « o1-preview ».
OpenAI promet que le nouveau modèle fonctionnera aussi bien qu'un doctorant sur des tâches de référence difficiles en physique, chimie et biologie. Cependant, les résultats préliminaires des tests montrent que cette IA est encore loin de son objectif de remplacer les scientifiques ou les programmeurs humains.
Sur les réseaux sociaux, de nombreux utilisateurs ont partagé leurs expériences d'interaction avec l'IA « OpenAI o1 », et les résultats ont montré que le modèle fonctionnait toujours mal sur les tâches de base.
Par exemple, Mathieu Acher, chercheur à l'INSA Rennes, a constaté qu'OpenAI o1 proposait fréquemment des mouvements illégaux lors de la résolution de certaines énigmes d'échecs.
Colin Fraser, scientifique en méta-IA, a souligné que dans une simple énigme sur les agriculteurs transportant des moutons à travers une rivière, l'IA a en fait abandonné la bonne réponse et a plutôt donné des absurdités illogiques.
Même dans le casse-tête logique utilisé par OpenAI comme démonstration, les questions impliquant des fraises ont conduit les utilisateurs à obtenir des réponses différentes, un utilisateur ayant constaté que le modèle présentait un taux d'erreur pouvant atteindre 75 %.
Non seulement cela, mais certains utilisateurs ont signalé que le nouveau modèle commet même des erreurs en comptant le nombre de fois où la lettre « R » apparaît dans le mot « fraise ».
Bien qu'OpenAI ait déclaré au moment de sa sortie qu'il s'agissait d'un premier modèle et qu'il ne disposait pas encore de fonctionnalités telles que la navigation Web et le téléchargement de fichiers, de telles erreurs fondamentales restent surprenantes.
Afin de s'améliorer, OpenAI a introduit le processus de « chaîne de réflexion » dans le nouveau modèle, rendant OpenAI o1 sensiblement différent du modèle GPT-4o précédent. Cette approche permet à l’IA de réfléchir encore et encore avant d’arriver à une réponse, même si cela entraîne également des temps de réponse plus longs.
Certains utilisateurs ont découvert qu’il fallait en réalité 92 secondes au modèle pour répondre à une énigme, mais le résultat était toujours erroné.
Noam Brown, chercheur chez OpenAI, a déclaré que même si la vitesse de réponse actuelle est lente, ils s'attendent à ce que les versions futures réfléchissent plus longtemps et fournissent même de nouvelles informations sur des problèmes révolutionnaires.
Cependant, le célèbre critique de l’IA Gary Marcus est sceptique à ce sujet et estime que le traitement à long terme ne conduit pas nécessairement à des capacités de raisonnement transcendantes. Il a souligné que malgré le développement continu de la technologie de l’IA, la recherche et les expériences réelles restent indispensables.
On peut constater qu'en utilisation réelle, les performances du nouveau modèle d'IA d'OpenAI sont toujours décevantes à tous égards, ce qui a également déclenché des discussions sur le développement futur de la technologie d'IA.
Souligner:
Récemment, OpenAI a lancé un nouveau modèle d'IA "Strawberry", prétendant être comparable aux doctorants dans des tâches complexes.
De nombreux utilisateurs ont constaté que l'IA commettait souvent des erreurs sur des tâches de base, telles que proposer des mouvements illégaux et répondre de manière incorrecte à des énigmes simples.
? OpenAI admet que le modèle est encore en développement, mais réfléchir longtemps pourrait ne pas améliorer les capacités de raisonnement et de nombreux problèmes fondamentaux restent en suspens.
Dans l’ensemble, bien que le modèle « o1-preview » d’OpenAI montre le potentiel de développement de la technologie de l’IA, il expose également de nombreuses lacunes dans son application pratique. À l’avenir, le développement de modèles d’IA devra encore trouver un équilibre entre amélioration technique et application pratique afin d’atteindre véritablement les objectifs escomptés. L'éditeur de Downcodes continuera de prêter attention aux tendances dans le domaine de l'IA et vous proposera des rapports plus passionnants.