Após um evento de transmissão ao vivo de compartilhamento de tecnologia de 12 dias, a OpenAI lançou o modelo de inferência de próxima geração o3, bem como uma versão simplificada do o3-mini otimizada para tarefas específicas. o3 fez progressos inovadores em vários testes de benchmark, seu desempenho supera significativamente o modelo da geração anterior o1 e até se aproxima do nível de inteligência artificial geral (AGI) em alguns aspectos. Este lançamento atraiu ampla atenção na indústria e acredita-se que terá um impacto profundo nos métodos de programação futuros e nos modelos de trabalho dos programadores.
Após 12 dias de compartilhamento de transmissão ao vivo de tecnologia, a OpenAI lançou seu modelo de inferência o3 de próxima geração no último dia, que é uma versão atualizada do modelo de inferência o1 lançado anteriormente. A série de modelos o3 inclui duas versões: o3 e o3-mini, das quais o3-mini é um modelo menor e simplificado, ajustado para tarefas específicas. OpenAI afirmou que o modelo o3 pode chegar perto de alcançar inteligência artificial geral (AGI) sob certas condições, ou seja, inteligência artificial que pode completar qualquer tarefa que os humanos possam realizar.
No benchmark de inferência lógica gráfica ARC-AGI, o modelo o3 alcançou pontuações recordes, marcando 75,7% no cenário de baixa computação, enquanto no teste de alta computação atingiu 87,5%, superando o benchmark que marca o alcance dos níveis humanos. Limite de 85%. Em comparação, o modelo o1 pontua apenas entre 25% e 32%, e o3 tem desempenho quase três vezes melhor que o1. Na mundialmente famosa plataforma de competição de codificação Codeforces, o3 alcançou uma pontuação de 2.727, enquanto o1 obteve apenas 1.891.
Fu Sheng, presidente da Cheetah Mobile ou Orion Star, disse que o lançamento do OpenAI o3 anuncia a chegada de uma era em que todos são programadores. Os usuários não precisam ser proficientes em Python ou C para escrever programas. apresentar requisitos e o grande modelo de previsão pode ajudar a concluir o trabalho de programação. Fu Sheng acredita que o lançamento do o3 marca que a capacidade de programação de grandes modelos de linguagem ultrapassa 99,9% dos programadores. Na competição de programação de classe mundial da Codeforces, o3 alcançou o resultado máximo de 175º lugar, enquanto o1 derrotou apenas mais de 90% dos. programadores, o GPT-4o derrotou apenas 11% dos programadores antes.
A OpenAI planeja lançar oficialmente o modelo o3 no final de janeiro do próximo ano. Fu Sheng destacou que, embora os programadores não desapareçam completamente, seu trabalho mudará mais para a compreensão das necessidades do usuário e a construção de uma grande lógica, e o trabalho de conversão das necessidades em código será amplamente concluído pela IA. Este lançamento anuncia a aplicação mais ampla da IA no campo da programação e também pode mudar a forma como os programadores trabalham.
O lançamento do modelo o3 marca um progresso significativo na tecnologia de inteligência artificial, e as suas poderosas capacidades de raciocínio e programação terão um impacto profundo em vários campos. No futuro, com o contínuo desenvolvimento e melhoria da tecnologia, podemos esperar que a inteligência artificial desempenhe um papel maior em mais campos e traga maior comodidade à sociedade humana.