杭州の AI 企業 DeepSeek は、OpenAI の GPT-4 や Anthropic の Claude 3.5Sonnet と同等のパフォーマンスを低コスト (560 万ドル) で実現する最新の大規模言語モデル V3 をリリースし、業界の注目を集めています。この成果は、限られたリソースの下での DeepSeek の強力な研究およびエンジニアリング能力を強調するものであり、また、大規模な言語モデルの研究開発のための新しいアイデアを提供し、高投資で高収益が達成できるという従来の概念に挑戦します。 V3 モデルの成功は、AI 分野における将来の開発のさらなる可能性を示す可能性があります。
最近、杭州にある AI 企業 DeepSeek が、最新の大規模言語モデル V3 をリリースしました。複数のベンチマーク テストにおけるこのオープン ソース モデルのパフォーマンスは、業界に衝撃を与えた OpenAI の 4o や Anthropic の Claude3.5Sonnet のパフォーマンスに近いものでした。アメリカの他社が投資した数億ドルと比較すると、DeepSeek の V3 モデルの総コストはわずか 560 万ドルです。この大きな違いは目を引くものです。
DeepSeek の CEO、Liang Wenfeng 氏は、V3 は H800 チップに基づいてトレーニングされているものの、DeepSeek チームは限られたリソースでも強力な研究能力とエンジニアリング能力を発揮できると語った。
AI分野の先駆者であるアンドレイ・カルパシー氏は、ディープシークの投資予算は「なんて冗談だろう」とコメントしたが、最終的な成果は「リソースの制約の下で非常に素晴らしい研究とエンジニアリング」だったという。
AGIはAI研究の「聖杯」とみなされており、問題解決やタスク実行において人間を超える能力があり、この技術が成熟すれば、最初にAGIを導入した国は経済的、科学的、安全保障上で大きなメリットを得られると予測している。
DeepSeek V3 モデルの成功は、画期的な進歩が低コストで達成できることを証明しただけでなく、より重要なことに、世界的な AI 研究開発に新たな視点と方向性を提供し、先進国に追いつく途上国にも利益をもたらします。人工知能の分野でのレベルが向上しました。今後も同様の「奇跡」が起こるかもしれない。