Downcodes の編集者は、中国の未公開株大手 Magic Square Quantitative の子会社である DeepSeek が最近、推論に焦点を当てた最新の大規模言語モデル R1-Lite-Preview をリリースしたことを知りました。このモデルは現在、Web チャットボット プラットフォーム DeepSeek Chat を通じてのみ公開されており、そのパフォーマンスは広く注目を集めており、OpenAI が最近リリースした o1-preview モデルに迫るかそれを上回っています。 DeepSeek はオープンソース AI エコシステムへの貢献で知られており、今回の立ち上げでもアクセシビリティと透明性への取り組みを継続します。
中国のプライベートエクイティ大手 Huifang Quantitative の子会社である DeepSeek は、最近、推論に焦点を当てた最新の大規模言語モデル R1-Lite-Preview をリリースしました。このモデルは現在、Web チャットボット プラットフォームである DeepSeek Chat を通じてのみ一般公開されています。
DeepSeek は、オープンソース AI エコシステムへの革新的な貢献で知られており、この新しいリリースは、アクセシビリティと透明性への取り組みを維持しながら、高レベルの推論機能を一般に提供することを目的としています。 R1-Lite-Preview は現在チャット アプリケーションでのみ利用可能ですが、最近リリースされた OpenAI の o1-preview モデルに近い、またはそれを超えるパフォーマンスで広く注目を集めています。
R1-Lite-Preview は「連鎖思考」推論を使用しており、ユーザーのクエリに応答するときに通過するさまざまな思考プロセスを表示できます。
一部の思考連鎖は人間にとって無意味または間違っているように見えるかもしれませんが、全体として、R1-Lite-Preview の答えは非常に正確であり、GPT-4o や Claude シリーズなどの一部の従来の強力な AI モデルが遭遇する「罠」も解決できます。たとえば、「イチゴ」という単語には R が何個ありますか?「9.11 と 9.9 ではどちらが大きいですか?」
DeepSeek によると、このモデルは論理的推論、数学的思考、リアルタイムの問題解決を必要とするタスクに優れています。そのパフォーマンスは、AIME (American Invitational Mathematics Exam) や MATH などの確立されたベンチマークで OpenAI o1-preview のレベルを上回っています。
さらに、DeepSeek はモデルに関する拡張データをリリースし、問題を解決するためにモデルにさらに多くの時間を与える、つまり「トークンを考える」と精度が着実に向上することを実証しました。このグラフは、思考の深さが増すにつれて、AIME などのベンチマークでのモデルのスコアが向上することを示しています。
R1-Lite-Preview の現在のリリースは、主要なベンチマークで良好なパフォーマンスを示し、複雑な数学から論理シナリオまでの幅広いタスクを処理でき、GPQA や Codeforces などのトップ推論モデルに匹敵するスコアを示しています。モデルの透過的な推論プロセスにより、ユーザーはその論理ステップをリアルタイムで観察できるため、システムの責任感と信頼性が高まります。
DeepSeek は、サードパーティによる独立した分析やベンチマーク用の完全なコードをリリースしておらず、独立したテスト用の API インターフェイスも提供していないことは注目に値します。同社は、トレーニングやテストについて説明した関連するブログ投稿や技術文書をまだ公開していません。 R1-Lite-Preview の構造には、その背後にある起源が依然として疑問に満ちています。
R1-Lite-Preview は現在、DeepSeek Chat (chat.deepseek.com) を通じて無料で利用できますが、その高度な「deep thought」モードは 1 日あたり 50 メッセージに制限されており、ユーザーはその強力な機能を体験できます。 DeepSeek は、オープンソース AI コミュニティの開発をさらにサポートするために、R1 シリーズ モデルと関連 API のオープンソース バージョンをリリースする予定です。
DeepSeek はオープンソース AI 分野のイノベーションを推進し続けており、R1-Lite-Preview のリリースにより、その推論とスケーラビリティに新たな次元が追加されました。企業や研究者が推論集約型 AI のアプリケーションを模索する中、DeepSeek のオープン性への取り組みにより、そのモデルが開発とイノベーションのための重要なリソースとなることが保証されます。
正式入口:https://www.deepseek.com/
全体として、R1-Lite-Preview は大規模言語モデルの分野における DeepSeek の強力な強みを示しており、そのオープンソース計画も期待に値します。ただし、コードや技術文書が開示されていないため、技術的な詳細については謎が多くあります。 Downcodes編集部では今後もDeepSeekの今後の動向に注目していきたいと思います。