الصين تحقق تقدماً كبيراً في مجال الذكاء الاصطناعي! أصدرت DeepSeek DeepSeek V3، وهو نموذج لغة كبير مفتوح المصدر بحجم معلمة يبلغ 671 مليارًا. ويتفوق أداؤه على العديد من النماذج مغلقة المصدر السائدة بما في ذلك GPT-4. لم يكن أداء DeepSeek V3 جيدًا في مسابقات البرمجة واختبارات تكامل التعليمات البرمجية فحسب، بل كان أيضًا ملفتًا للنظر بتكلفة التطوير الفعالة - شهرين فقط و5.5 مليون دولار - وهو ما يتناقض بشكل حاد مع الاستثمار في تطوير المنتجات المماثلة. ويكمن وراء هذا الإنجاز الدعم القوي من صندوق التحوط الكمي High-Flyer Capital Management، الذي استثمر في بناء مجموعات خوادم قوية.
أصدرت شركة الذكاء الاصطناعي الصينية DeepSeek مؤخرًا نموذجًا بارزًا مفتوح المصدر للغة كبيرة الحجم DeepSeek V3. هذا النموذج الذي يحتوي على 671 مليار معلمة لا يتجاوز نطاق Meta's Llama3.1 فحسب، بل يتفوق أيضًا على النماذج مغلقة المصدر السائدة بما في ذلك GPT-4 في اختبارات قياس الأداء المتعددة.
تتمثل الميزات البارزة لبرنامج DeepSeek V3 في أدائه القوي وعملية التطوير الفعالة. كان أداء النموذج جيدًا في المسابقات على منصة البرمجة Codeforces، وتصدر منافسيه في اختبار Aider Polyglot، الذي يختبر قدرات تكامل التعليمات البرمجية. يستخدم تدريب النموذج مجموعة بيانات ضخمة مكونة من 14.8 تريليون رمز، ويصل حجم المعلمة إلى 1.6 ضعف حجم Llama3.1.
والأمر الأكثر إثارة للدهشة هو أن DeepSeek أكمل التدريب النموذجي في شهرين فقط وبتكلفة قدرها 5.5 مليون دولار أمريكي، وهو أقل بكثير من الاستثمار في تطوير منتجات مماثلة.
الداعم وراء DeepSeek هو صندوق التحوط الكمي الصيني High-Flyer Capital Management. استثمر الصندوق في مجموعة خوادم تحتوي على 10000 وحدة معالجة رسوميات Nvidia A100 تبلغ قيمتها حوالي 138 مليون دولار. وقال ليانج وينفينج، مؤسس شركة High-Flyer، إن الذكاء الاصطناعي مفتوح المصدر سيكسر في النهاية ميزة الاحتكار للنموذج المغلق الحالي.
تم إصدار DeepSeek V3 بموجب ترخيص متساهل، مما يسمح للمطورين بتنزيله وتعديله واستخدامه لمختلف التطبيقات، بما في ذلك الأغراض التجارية. على الرغم من أن تشغيل الإصدار الكامل لا يزال يتطلب دعمًا قويًا للأجهزة، إلا أن إصدار هذا النموذج مفتوح المصدر يمثل خطوة مهمة للابتكار المفتوح في مجال الذكاء الاصطناعي.
إن الإصدار المفتوح المصدر من DeepSeek V3 لا يعزز تقدم تكنولوجيا الذكاء الاصطناعي فحسب، بل يوفر أيضًا المزيد من الفرص للمطورين العالميين، مما يشير إلى أن التطوير المستقبلي في مجال الذكاء الاصطناعي سيكون أكثر انفتاحًا وتنوعًا. كما توفر عملية التدريب منخفضة التكلفة وعالية الكفاءة خبرة ومرجعًا قيمين للمؤسسات والشركات البحثية الأخرى، ومن الجدير التطلع إلى التطوير اللاحق.