最近の Reddit Q&A で、OpenAI CEO の Sam Altman 氏は、同社が新製品を頻繁に発表できない主な理由の 1 つはコンピューティング能力の不足であると認めました。同氏は、現在のAIモデルはますます複雑化しており、OpenAIは多くの優れたアイデアを実現するためにコンピューティングリソースをどのように割り当てるかについて多くの制限と難しい決断に直面していると述べた。
複数のレポートによると、OpenAI は十分なコンピューティング インフラストラクチャを入手することが困難になっています。ロイター通信は今週、関係筋の話として、OpenAIがBroadcomと協力して自社モデルを実行するためのAIチップを開発しており、2026年までに発売される予定だと伝えた。
Altman 氏は、コンピューティング能力の制約のため、当初計画されていた ChatGPT の Advanced Voice Mode のビジュアル機能は短期的には導入されないことを明らかにしました。 OpenAIは4月の記者会見の時点で、同社のChatGPTアプリケーションがスマートフォン上で動作し、カメラの視野内の人々が着ている衣服などの視覚情報を識別できることを示した。しかし、報道によると、このデモンストレーションは Google I/O 開発者カンファレンスの注目を盗もうとする試みであり、OpenAI 社内の従業員の多くは GPT-4o を公開する準備ができていないと考えています。
Altman 氏は Q&A の中で、OpenAI の画像生成プログラム DALL-E の次のメジャー アップデートのリリース日は未定であると述べました。一方、OpenAIのビデオ生成ツールSoraは、モデルの改良、セキュリティの確保、コンピューティング能力の拡張の必要性により遅れている。 Sora は技術面でもいくつかの挫折を経験しており、Luma や Runway などの競合他社に対して不利な立場にあります。
さらに、10月にはSoraの共同責任者であるTim Brooks氏がGoogleに移籍するために退職した。アルトマン氏はQ&Aの中で、OpenAIがChatGPTで「アダルトコンテンツ」を許可するかどうかまだ検討中であると述べ、同社の現在の優先事項はo1シリーズの「推論」モデルとその後のバージョンのパフォーマンスを向上させることだと述べた。今週の DevDay カンファレンスで、OpenAI は画像理解など、今後の新機能をいくつか披露しました。
「今年後半には非常に優れた新しいバージョンがいくつか登場する予定ですが、それを GPT-5 とは呼びません」とアルトマン氏は結論づけた。