中国の DeepSeek チームによってオープンソース化された大型モデル R1 は、パフォーマンスとコストの面で印象的な利点を示し、世界のテクノロジー コミュニティから幅広い注目を集めています。特に数学とプログラミングの分野で、多くの信頼できるテストで OpenAI の o1 モデルを上回っており、その非常に低コストの利点が際立っており、オープンソースの大規模モデルの分野におけるダークホースとなっています。 R1 のオープンソースは、大型モデル技術分野における中国の躍進を実証するだけでなく、世界的な AI 開発に新たな活力を注入します。
本文: 最近、中国の DeepSeek チームが最新のオープンソース大型モデル R1 を発表し、広く注目を集めました。 R1 モデルのパフォーマンスは非常に優れており、多くのテスト、特に数学とプログラミングの評価において OpenAI の o1 モデルを上回っています。
最新のアメリカのAIME2024テストでは、R1が79.8点を獲得し、o1の79.2点を上回りました。 MATH-500 テストでは、R1 は 97.3 点を獲得し、これも o1 の 96.4 点を上回りました。さらに、SWE ベンチ Verified テストでは、R1 のスコアは 49.2 で、これも o1 のスコア 48.9 を上回りました。コード テスト Codeforces では、R1 は o1 よりも 0.3 ポイント低いだけですが、全体的なパフォーマンスは o1 モデルと同等です。
性能に加えて、R1 のコストメリットもさらに目を引きます。 OpenAI の o1 モデルの入力手数料は 100 万トークンあたり最大 15 米ドルですが、R1 のコストはわずか 0.14 米ドルで、コストが 90% 削減されます。生産量に関しては、o1 の手数料は 100 万トークンあたり 60 米ドルですが、R1 の料金はわずか 2.19 米ドルで、27 分の 1 に削減されます。この大きなコスト差により、R1 はオープンソースの大規模モデルの分野で際立っています。
DeepSeek チームが R1 がオープンソースであると発表した後、多くの海外ネットユーザーは、R1 がコストパフォーマンスとパフォーマンスの点で Meta や Mistral などの確立されたオープンソース プラットフォームを上回っていると信じて、このモデルに対する賞賛の意を表明しました。 R1 モデルの効率的な推論能力により、コード記述や数学的説明に優れていると多くの人が評価しており、「人間の内面の独白に最も近いモデル」と呼ぶユーザーもいます。同時に、Apple の機械学習研究者である Awni Hannun も R1 をテストし、Apple M2Ultra 上で高速に動作し、推論効率が高いことを発見しました。
R1 モデルの開発では、推論機能と可読性を向上させるためのコールド スタート データと多段階トレーニングを含む、複数段階のトレーニング プロセスを経ました。これらの技術的改善により、R1 モデルはさまざまなタスクにおいて優れたパフォーマンスを発揮します。
R1のリリースにより、中国の大規模なオープンソースモデルは国際市場で再び大きな注目と議論を集めており、多くのテクノロジー愛好家がこのモデルの可能性に期待を表明しています。 R1 のリリースは、大型モデル技術分野における中国のさらなる躍進を示し、オープンソース技術の開発を促進します。
オープンソースのアドレス: https://huggingface.co/deepseek-ai/R1
API: https://api-docs.deepseek.com/guides/reasoning_model
ハイライト:
R1 モデルは複数のテストで OpenAI の o1 を上回り、優れたパフォーマンスを示しました。
R1 の入力コストと出力コストはそれぞれ 0.14 ドルと 2.19 ドルと低く、コストは 90% 削減されます。
R1 はオープンソース化されて以来、広く注目を集めており、多くの海外の専門家がそのパフォーマンスを賞賛し、非常に費用対効果が高いと考えています。
R1 の出現は、開発者に高性能かつ低コストの強力なツールを提供するだけでなく、中国の人工知能分野における継続的な革新と競争力の向上の先駆けでもあります。 R1 が今後さらに多くの分野にブレークスルーをもたらすことを期待しています。