魔方陣量子化が DeepSeek-V3 をリリース: GPT-4 に匹敵するパフォーマンス、トレーニングコストが過去最低に達する
Magic Square Quantitative は 12 月 26 日の夜、新世代の大型モデル DeepSeek-V3 をリリースし、驚くべき技術的進歩を示しました。 MoE (Mixed Experts) アーキテクチャを使用したこのモデルは、上位のクローズドソース モデルと性能が同等であるだけでなく、その低コストと高効率の機能が業界の注目を集めています。コアパラメータから、DeepSeek-V3 には 671 のパラメータがあります。
2024-12-30