Em uma recente sessão de perguntas e respostas no Reddit, o CEO da OpenAI, Sam Altman, admitiu que a falta de poder computacional é uma das principais razões pelas quais a empresa não consegue lançar novos produtos com frequência. Ele disse que os modelos atuais de IA estão se tornando cada vez mais complexos e que a OpenAI enfrenta muitas limitações e decisões difíceis sobre como alocar recursos de computação para concretizar muitas ideias excelentes.
De acordo com vários relatórios, a OpenAI encontrou dificuldades em obter infraestrutura computacional suficiente. Esta semana, a Reuters citou fontes dizendo que a OpenAI está trabalhando com a Broadcom para desenvolver um chip de IA para executar seus modelos, que deverá estar disponível em 2026.
Devido a restrições de poder de computação, Altman revelou que os recursos visuais originalmente planejados no Modo de Voz Avançado do ChatGPT não serão lançados no curto prazo. Já na coletiva de imprensa de abril, a OpenAI mostrou que seu aplicativo ChatGPT roda em smartphones e pode identificar informações visuais, como roupas usadas por pessoas no campo de visão da câmera. No entanto, os relatórios indicam que esta demonstração é uma tentativa de roubar a atenção da conferência de desenvolvedores Google I/O, e muitos funcionários internos da OpenAI acreditam que o GPT-4o não está pronto para ser tornado público.
Nas perguntas e respostas, Altman mencionou que não há data de lançamento para a próxima grande atualização do gerador de imagens DALL-E da OpenAI. Enquanto isso, a ferramenta de geração de vídeo Sora da OpenAI foi adiada pela necessidade de refinar modelos, garantir segurança e expandir o poder computacional. Sora também sofreu alguns contratempos técnicos, colocando-o em desvantagem contra concorrentes como Luma e Runway.
Além disso, em outubro, o codiretor da Sora, Tim Brooks, saiu para ir para o Google. Altman mencionou nas perguntas e respostas que a OpenAI ainda está considerando se permitirá “conteúdo adulto” no ChatGPT, e disse que a prioridade atual da empresa é melhorar o desempenho do modelo de “inferência” da série o1 e suas versões subsequentes. Na conferência DevDay desta semana, a OpenAI mostrou alguns novos recursos futuros, incluindo compreensão de imagens.
“Teremos novas versões muito legais sendo lançadas ainda este ano, mas não vamos chamá-las de GPT-5”, concluiu Altman.