中国の定量的投資大手の子会社であるDeepseekは、最近、最新の推論をリリースし、このモデルはDeepSeek Chat Web Chat Robotプラットフォームを通じてのみ公開されています。 R1-Lite-Previewは、「チェーン思考」の推論を使用します。これは、特定の思考チェーンがナンセンスであると思われる場合に経験した思考プロセスを示すことができます。伝統的な伝統強力なAIモデルに対処することは困難です。このモデルは、複数のベンチマークテストでOpenAIがリリースした最近リリースされたO1-Previewモデルを上回ります。
Deepseekは、オープンソースのAIエコシステムでのイノベーションの貢献で知られています。現在、R1-Lite-Previewはチャットアプリケーションで入手可能ですが、最近リリースされたO1-Previewモデルによって最近リリースされたO1-Previewモデルのパフォーマンスにより、広範な注目を集めています。 R1-Lite-Previewは「チェーン思考」推論を使用します。これは、ユーザーの問い合わせに対応するときに経験するさまざまな思考プロセスを示すことができます。
一部の思考チェーンは、人間にとってナンセンスやエラーのように思えるかもしれませんが、R1-Lite-Previewの答えは非常に正確であり、たとえばGPT-4OやClaudeシリーズなどの従来の強力なAIモデルを解決することさえできます、「ストロベリー」rという言葉には何文字がありますか? "これは9.11と9.9ですか?"
DeepSeekによると、このモデルは、論理的推論、数学的思考、および実際の時間の問題のタスクでうまく機能しました。そのパフォーマンスは、AIME(米国の招待数学試験)と数学の確立されたベンチマークテストのOpenai O1-Previewのレベルを上回ります。
さらに、DeepSeekはモデルの拡張データもリリースし、モデルにより多くの時間を与えたり、問題を解決するために「思考トークン」を与えたときの安定した精度の傾向を示しています。チャートは、思考の深さが増加するにつれて、AIMEのベンチマークのモデルのスコアが増加していることを強調しています。
現在、R1-Lite-Previewのリリースは、複雑な数学から論理シナリオまでの一連のタスクを処理できます。このモデルの透明な推論プロセスにより、ユーザーは論理的なステップをリアルタイムで観察し、システムの責任と信頼性を高めることができます。
DeepSeekは、サードパーティの独立した分析やベンチマークテストの完全なコードをリリースしていないことも注目に値します。また、独立したテストのためのAPIインターフェイスを提供していません。
R1-Lite-Previewは現在、DeepSeekチャット(chat.deepseek.com)を通じて無料で使用できますが、その高レベルの「ディープ思考」モデルは1日あたり50ニュースに制限されており、ユーザーは強力な機能を体験できます。 Deepseekは、R1シリーズモデルのオープンソースバージョンと関連するAPIをリリースして、オープンソースAIコミュニティの開発をさらにサポートする予定です。
Deepseekは、オープンソースAIの分野でのイノベーションを引き続き促進し、R1-Lite-Previewのリリースにより、その推論とスケーラビリティに新しい次元が追加されました。企業と研究者の適用を適用して、推論の密にAIの適用を調査することで、DeepSeekのオープンなコミットメントにより、そのモデルが開発と革新のための重要なリソースになることが保証されます。
公式入り口:https://www.deepseek.com/
ポイント:
Deepseekは、Openai O1に近い、それを上回るR1-Lite-Previewモデルをリリースしました。
モデルは透明な推論プロセスを示し、ユーザーはロジックの手順をリアルタイムで観察できます。
深い学習と論理的推論機能は重要であり、将来的にはオープンソースのバージョンとAPIがリリースされます。
全体として、DeepSeekがリリースしたR1-Lite-Previewモデルは、推論能力に大きな利点を示しており、その透明な推論プロセスと将来のオープンソース計画も楽しみにしています。 ただし、現在のパブリックコードと技術文書の不足により、そのパフォーマンスの包括的な評価は限られています。