OpenAI が新たにリリースした o3AI モデルは、その強力なパフォーマンスと高い運用コストで業界の注目を集めています。このモデルは ARC-AGI ベンチマークで素晴らしい結果を達成しましたが、ミッションごとに 1,000 ドル以上のコストがかかり、前モデルよりもはるかに高価でした。これは、人工知能モデルのパフォーマンス向上とコスト管理の間の矛盾を浮き彫りにし、また、「スケーリング」アプローチにおける利益逓減についての議論を引き起こします。この記事では、o3AI モデルのパフォーマンス、コスト、将来の開発について詳細に分析します。
OpenAI が最近発表した o3AI モデルは、同社の最も強力な人工知能製品とみなされていますが、そのランニングコストは驚異的であり、1 つのタスクに 1,000 ドル以上かかります。
TechCrunch によると、新しいモデルは複雑な問題を扱うときに「テスト時計算」と呼ばれる手法を使用しており、答えに到達する前に、より多くの時間をかけて考え、複数の可能性を探索することを意味します。したがって、OpenAI エンジニアは、o3 が複雑なプロンプトに対してより良い応答を生成できることを期待しています。
ARC-AGI ベンチマークの創設者である François Chollet 氏によると、o3 は強力な「ハイ コンピューティング モード」で 87.5% のスコアを達成しました。これは、前世代の o1 モデルのスコア 32% のほぼ 3 倍です。これは、o3 のパフォーマンスが大幅に向上していることを示しています。ただし、この複雑な計算プロセスには多大なオーバーヘッドが伴います。この高いスコアを達成するために、O3 のコンピューティング コストはタスクあたり 1,000 ドルを超え、O3 の低電力バージョンの 170 倍のコンピューティング パワーを使用し、タスクあたりのコストが 4 ドル未満だった以前のバージョンよりも大幅に高くなりました。
この状況により、業界は o3 モデルのパフォーマンスと運用コストの矛盾に注目するようになりました。一方で、o3 のスコアの大幅な向上は、人工知能モデルが「スケーリング」、つまり処理能力とトレーニング データを追加することによってまだ進歩できることを証明しているようです。しかしその一方で、拡大の成果が逓減していることへの批判も高まっている。 o3 の改善は、単純な拡張ではなく主に「推論」方法の改善によるものですが、その運用コストの高さが人々を不安にさせていることは間違いありません。
ベンチマークで 76% のスコアを記録した o3 の低コンピューティング バージョンでさえ、タスクごとに約 20 ドルかかり、以前のバージョンと比べて比較的安価なオプションとなっています。さらに、ChatGPT Plus の料金が月額わずか 25 米ドルであることを考慮すると、OpenAI は、ユーザーが使用するインテリジェンスのレベルを向上させる際に大きなコスト圧力に直面します。
Chollet氏は、ベンチマーク結果に関するブログ投稿の中で、o3は人間のパフォーマンスレベルに近づいているものの、「コストは依然として高く、まだ経済的ではない」と指摘した。同氏によると、ARC-AGI タスクを解決するための人件費は 1 タスクあたり約 5 ドルだが、エネルギー消費はわずか数セントだという。しかし、同氏は「今後数カ月、数年で費用対効果は大幅に改善されるだろう」と楽観視している。現時点ではo3は一般公開されておらず、その「ミニバージョン」は来年1月に発売される予定だ。 。
ハイライト:
o3AI モデルの 1 つのクエリには 1,000 ドル以上のコストがかかり、実行コストが高いことがわかります。
ARC-AGI ベンチマークでは、o3 のスコアは 87.5% で、前世代の o1 モデルのほぼ 3 倍でした。
現時点ではo3は一般公開されておらず、「ミニ版」は来年1月に発売される予定だ。
全体として、o3AI モデルは、人工知能テクノロジーの強力な発展の可能性を示していますが、高コストによってもたらされる課題も明らかにしています。今後、人工知能分野では性能向上とコスト抑制をいかに両立させるかが重要な課題となり、優れた性能を維持しながらコストを削減できるかどうかのo3AIモデルの「ミニ版」にも大きな期待が寄せられています。引き続き注目。