Dans une récente séance de questions-réponses sur Reddit, Sam Altman, PDG d'OpenAI, a admis que le manque de puissance de calcul est l'une des principales raisons pour lesquelles l'entreprise ne peut pas lancer fréquemment de nouveaux produits. Il a déclaré que les modèles d'IA actuels deviennent de plus en plus complexes et qu'OpenAI est confronté à de nombreuses limitations et à des décisions difficiles sur la manière d'allouer les ressources informatiques pour concrétiser de nombreuses excellentes idées.
Selon plusieurs rapports, OpenAI a rencontré des difficultés pour obtenir une infrastructure informatique suffisante. Cette semaine, Reuters a cité des sources affirmant qu'OpenAI travaillait avec Broadcom pour développer une puce d'IA pour exécuter ses modèles, qui devrait être disponible d'ici 2026.
En raison de contraintes de puissance de calcul, Altman a révélé que les capacités visuelles initialement prévues dans le mode vocal avancé de ChatGPT ne seront pas lancées à court terme. Dès la conférence de presse d'avril, OpenAI a montré que son application ChatGPT fonctionne sur les smartphones et peut identifier des informations visuelles telles que les vêtements portés par les personnes dans le champ de vision de la caméra. Cependant, des rapports indiquent que cette démonstration est une tentative de détourner l'attention de la conférence des développeurs Google I/O, et de nombreux employés internes d'OpenAI pensent que GPT-4o n'est pas prêt à être rendu public.
Dans la séance de questions-réponses, Altman a mentionné qu'il n'y avait pas de date de sortie pour la prochaine mise à jour majeure du générateur d'images DALL-E d'OpenAI. Pendant ce temps, l'outil de génération vidéo d'OpenAI, Sora, a été retardé par la nécessité d'affiner les modèles, d'assurer la sécurité et d'étendre la puissance de calcul. Sora a également subi quelques revers techniques, ce qui le désavantage face à des concurrents tels que Luma et Runway.
De plus, en octobre, le co-responsable de Sora, Tim Brooks, est parti chez Google. Altman a mentionné dans la séance de questions-réponses qu'OpenAI réfléchissait toujours à l'opportunité d'autoriser le « contenu pour adultes » dans ChatGPT, et a déclaré que la priorité actuelle de l'entreprise est d'améliorer les performances du modèle « d'inférence » de la série o1 et de ses versions ultérieures. Lors de sa conférence DevDay cette semaine, OpenAI a présenté de nouvelles fonctionnalités à venir, notamment la compréhension des images.
"Nous allons avoir de très belles nouvelles versions qui sortiront plus tard cette année, mais nous ne l'appellerons pas GPT-5", a conclu Altman.