O cofundador da Anthropic, Jack Clark, apontou recentemente em seu boletim informativo “Import AI” que o desenvolvimento da inteligência artificial não está desacelerando, mas acelerando. Ele tomou o modelo o3 da OpenAI como exemplo para ilustrar que o progresso da IA não depende mais apenas da expansão do tamanho do modelo, mas recorre a um novo modelo que combina aprendizagem por reforço e poder de computação mais poderoso para alcançar "pensar enquanto corre". Isto marca uma nova etapa no desenvolvimento da IA, e a integração de métodos tradicionais e tecnologias emergentes tornar-se-á uma tendência de desenvolvimento futuro.
Recentemente, outra grande novidade que tem chamado a atenção na área de inteligência artificial vem de Jack Clark, cofundador da Anthropic. Na sua newsletter, Import AI, ele refuta alegações anteriores de que o progresso da IA está a abrandar, argumentando que o seu desenvolvimento está, na verdade, a acelerar. Clark mencionou que o modelo o3 lançado recentemente pela OpenAI mostra que a IA ainda tem muito espaço para crescimento, mas seus métodos de implementação estão mudando.
Ao contrário dos métodos tradicionais, o modelo o3 não se limita a impulsionar o progresso aumentando o tamanho do modelo, mas utiliza aprendizagem por reforço e um poder de computação mais poderoso. Durante o processo de execução do modelo, o3 tem a capacidade de “pensar enquanto executa”, o que abre novas possibilidades para futuras expansões. Clark prevê que esta tendência de combinar métodos tradicionais com tecnologias emergentes irá acelerar em 2025, quando mais empresas combinarem grandes modelos básicos com novos métodos de computação para promover o progresso da IA.
No entanto, Clark também destacou que por trás do rápido desenvolvimento há um desafio que não pode ser ignorado: o custo da computação. Ele disse que a versão avançada do o3 requer 170 vezes o poder de computação da versão básica, enquanto o consumo de recursos da versão básica ultrapassou o do o1, e o consumo de energia do próprio o1 também é maior que o do GPT-4o. Os requisitos de recursos destes novos sistemas variam de tarefa para tarefa, tornando as previsões de custos cada vez mais complexas. No passado, a sobrecarga do modelo estava relacionada principalmente ao tamanho do modelo e ao comprimento da saída, mas a flexibilidade do o3 torna isso muito menos previsível.
No entanto, Clark acredita firmemente que através da combinação de métodos tradicionais de escalonamento e novos métodos, o desenvolvimento da IA em 2025 será mais significativo do que antes. Quando se trata dos planos futuros da Anthropic, a previsão de Clark gerou muita agitação. A Anthropic ainda não lançou um modelo de “inferência” ou “tempo de teste” que concorra com a série O da OpenAI ou com o Gemini Flash Thinking do Google. O modelo carro-chefe da empresa, Opus3.5, foi temporariamente arquivado devido à melhoria insuficiente de desempenho. No entanto, a pesquisa e o desenvolvimento deste modelo não falharam completamente. Em vez disso, ele desempenhou um papel importante no treinamento do novo modelo Sonnet3.5, que se tornou o. modelo mais popular do mercado.
Destaque:
O desenvolvimento da IA não está a abrandar, mas sim a acelerar, especialmente modelos que combinam métodos de computação tradicionais e emergentes.
A capacidade de “pensar enquanto executa” do modelo o3 abre novas possibilidades de expansão e injeta poder no desenvolvimento futuro da IA.
Apesar do rápido progresso, a incerteza dos custos computacionais continua a ser um desafio para o desenvolvimento futuro.
Em suma, a análise de Clark mostra-nos um novo rumo no desenvolvimento da IA, ou seja, ao mesmo tempo que buscamos maior desempenho, precisamos estar atentos ao controle dos custos computacionais. O futuro desenvolvimento da IA prestará mais atenção ao equilíbrio entre eficiência e custo, que se tornará um dos principais factores que impulsionam o progresso da tecnologia de IA. Embora ainda existam desafios, o ritmo da inovação no domínio da IA não irá parar.