DeepSeek は、OpenAI の o1 の正式版に匹敵するパフォーマンスを持つ大規模言語モデル R1 の正式リリースとオープンソースを発表しました。 R1 は、トレーニング後の段階で強化学習テクノロジーを広範囲に使用しており、データ アノテーションの量が少ない場合でも、強力な推論能力を維持し、数学、コード、自然言語推論で優れたパフォーマンスを発揮します。 DeepSeek はまた、パラメータ サイズが 660B の 2 つのモデル、R1 および R1-Zero と、モデル蒸留技術を使用した 32B および 70B パラメータ モデルを含む 6 つの小型モデルをオープンソース化し、そのパフォーマンスは OpenAI の o1-mini を上回りました。さらに、DeepSeek は競争力の高い API 価格プランを提供し、MIT ライセンスを採用しているため、無制限の商用利用が可能であり、ユーザーが R1 に基づいて二次開発を行うことを奨励しています。
DeepSeek R1 は、パフォーマンス、オープンソース戦略、API 価格設定の面でその強力な強みとオープンな姿勢を実証しており、これは国内 AI テクノロジーの大きな進歩を示し、世界の AI 開発者により多くの選択肢と可能性を提供します。オープンソースの R1 と関連リソースの公開は、AI テクノロジーの普及と発展を促進し、AI テクノロジーにおける平等な権利の時代の到来を加速します。 詳細については、リンクを参照してください。 論文: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf API ドキュメント: https://api-docs.deepseek.com/zh-cn /guides/reasoning_model