OpenAI は、新しい経済的な AI モデル GPT-4o mini をリリースしました。そのコストは大幅に削減されていますが、そのパフォーマンスは AI テクノロジーの幅広い応用に向けた重要な一歩となります。この記事では、GPT-4o mini のパフォーマンス、セキュリティ、価格の利点、および将来の AI 開発への影響について詳しく説明します。
OpenAI はさらに大きな動きをしました!最新の GPT-4o mini は「最も手頃な価格の」小型モデルであると主張されています。これは単なるモデルのアップグレードではなく、インテリジェント革命の始まりです。今日は、GPT-4o mini の謎を明らかにし、GPT-4o mini がどのようにして知性をより「根拠のある」ものにすることができるのかを見てみましょう。
賢くお金を節約しよう
OpenAI のビジョンは、あらゆる場所にインテリジェンスを実現することであり、GPT-4o mini はこのビジョンの最新の実装です。このモデルはコストを大幅に削減しただけでなく、パフォーマンスの面でも優れています。入力トークン 100 万あたりわずか 15 セント、出力トークン 100 万あたり 60 セントで、これまでの最先端モデルよりも 1 桁安く、GPT-3.5 Turbo よりも 60% 以上安いです。
小さな身長、大きな知恵
GPT-4o mini は、テキスト インテリジェンスとマルチモーダル推論の両方において、学術ベンチマークにおいて GPT-3.5 Turbo や他の小型モデルを上回っています。また、GPT-4o と同じ言語範囲をサポートし、関数呼び出しに優れているため、開発者はデータを取得したり、外部システムとの操作を実行したりできるアプリケーションを構築でき、GPT-3.5 Turbo と比較してロングコンテキストのパフォーマンスが向上しました。
主要なベンチマークでは、GPT-4o mini は次のように動作しました。
推論タスク:テキストと視覚を含む推論タスクでは、GPT-4o mini のスコアは 82.0% でしたが、Gemini Flash の 77.9%、Claude Haiku の 73.8% と比較して、
数学とコーディング能力: GPT-4o mini は、数学的推論とコーディングのタスクでも優れたパフォーマンスを発揮しました。 MGSM (数学的推論) テストでは、87.0% のスコアを獲得しました。これに対し、Gemini Flash は 75.5%、Claude Haiku は 71.7% でした。 HumanEval (エンコーディング パフォーマンス) テストでは、Gemini Flash の 71.5%、Claude Haiku の 75.9% と比較して、87.2% のスコアを獲得しました。
マルチモーダル推論: MMMU (マルチモーダル推論評価) では、GPT-4o mini のスコアは 59.4%、Gemini Flash のスコアは 56.1%、Claude Haiku のスコアは 50.2% でした。
組み込みのセキュリティ対策
セキュリティは常に openAI モデル開発の中核です。事前トレーニング段階で、openAI は、ヘイトスピーチ、アダルト コンテンツ、主に個人情報を集約する Web サイト、スパムなど、モデルに学習または出力させたくない情報をフィルターで除外します。トレーニング後、openAI は強化学習やヒューマン フィードバック (RLHF) などの手法を使用して、モデルの動作を openAI のポリシーに合わせて調整し、モデルの応答の精度と信頼性を向上させます。
GPT-4o mini には、GPT-4o と同じセキュリティ緩和策が組み込まれています。openAI は、独自の準備フレームワークと自主的な取り組みに基づいた自動評価と人間による評価を通じて慎重に評価しました。社会心理学や誤った情報などの分野の 70 人以上の外部専門家が GPT-4o をテストして潜在的なリスクを特定しました。現在、openAI はこれに対処しており、次期 GPT-4o システム カードとレディネス スコア カードの詳細に含める予定です。これらの専門家による評価から得られた洞察は、GPT-4o および GPT-4o mini のセキュリティの向上に役立ちました。
入手可能性と価格
GPT-4o mini は、アシスタント API、チャット完了 API、およびバッチ API でテキストおよびビジュアル モデルとして利用できるようになりました。開発者は、100 万の入力トークンあたり 15 セント、100 万の出力トークンあたり 60 セントを支払います (標準的な本の 2500 ページにほぼ相当)。今後数日以内に GPT-4o mini の微調整機能を展開する予定です。
ChatGPT では、Free、Plus、Team ユーザーは今日から GPT-3.5 に代わって GPT-4o mini にアクセスできるようになります。 AI のメリットを誰もが利用できるようにするという openAI の使命に沿って、企業ユーザーも来週からアクセスできるようになります。
今後の展望
OpenAI チームは次のように述べています。「過去数年間、私たちはコストを大幅に削減しながら AI インテリジェンスが大幅に進歩しました。たとえば、2022 年にそれほど強力ではない text-davinci-003 モデルが発売されて以来、GPT-4o mini のコストは大幅に削減されました。トークンは 99% 減少しました。私たちはモデルの機能を強化しながらコストを削減し続けることに取り組んでいます。」
「私たちは、モデルがすべてのアプリとすべての Web サイトにシームレスに統合される未来を構想しています。GPT-4o mini は、開発者が強力な AI アプリケーションをより効率的かつ手頃な価格で構築および拡張できるようにする道を開きます。AI の未来は、よりアクセスしやすく、信頼性が高くなります。私たちは日々のデジタル体験に組み込まれており、今後もその先頭に立つことに興奮しています。」
全体として、GPT-4o mini は、優れたパフォーマンス、経済的な価格、強力なセキュリティ対策により、AI アプリケーションの普及に強固な基盤を提供しており、AI テクノロジーが私たちの生活により広く統合されることを示しています。