最近、Openaiは最新の推論モデルO3に関する調査レポートをリリースし、プログラミングの分野での大規模な言語モデル(LLMS)の大幅な進歩を示しています。 O3モデルは、有名なプログラミングプラットフォームCodeforcesで2724の高いスコアを達成し、世界の上位99.8%にランク付けされ、非常にうまく機能しました。さらに、このモデルは、2024年の国際情報学(IOI)で金メダルレベルを獲得し、プログラミングコンペティションでの優れた能力を示しています。
画像ソースノート:画像はAIによって生成され、画像認定サービスプロバイダーMidjourney
調査によると、O3モデルは、イベントのために特別に微調整されたO1-IOIモデルを超えてIOIコンペティションで実行されます。この結果は、プログラミングの分野における補強学習の大きな可能性を明らかにし、強化学習を通じて訓練された一般的なモデルがハンドデザインのためにドメイン固有のソリューションを超えて行くことができることを示唆しています。 IOI 2024イベントでは、O3は標準条件下で金メダルのしきい値を越え、同時にCodeForcesプラットフォーム上の世界トップ200のプログラマーにランク付けされ、トップの人間プログラマーと競合する強さを示しました。
ウォートンの准教授であるイーサン・モリックは、次のように述べています。機能により、大規模な一般的なモデルがより良い結果を達成できます。
この研究は、OpenAIが競争力のあるプログラミングとより広いソフトウェアエンジニアリング分野におけるモデルのパフォーマンスに関する評価の一部です。一方、別のAI企業であるAnthropicは、今週の月曜日に職場に対するAIの影響に関するレポートも発表しました。報告書は、職業の約36%が作業タスクの少なくとも25%でAIを使用しているのに対し、AIアプリケーションの57%が人間の能力を改善し、43%が自動化に焦点を当てていると指摘しています。それにもかかわらず、職業の4%のみが作業タスクの少なくとも75%に使用されているため、AIは職場でのAIの適用のための開発の余地がまだあることを示しています。
また、レポートは、ソフトウェア開発とテクニカルライティングがAIアプリケーションの主要分野であり、AIは環境との物理的相互作用を含むタスクにおいて比較的小さな役割を持っていることを指摘しています。この発見は、異なる分野でのAIの適用の違いを明らかにし、将来の技術開発の方向性も提供します。
要約すると、コードフォースとIOIのO3モデルの優れたパフォーマンスは、プログラミングの分野での強力な補強学習の可能性を示しています。同時に、職場でのAIの広範な使用、特にソフトウェア開発とテクニカルライティングの分野での優れたパフォーマンスは、AIテクノロジーが将来のあらゆる生活の展開の変化を促進し続けることを示しています。