في نهاية العام، أطلقت شركة Beijing Zhipu Huazhang Technology Co., Ltd. الإصدار الأول من GLM-Zero، وهو أول نموذج استدلالي تم تدريبه استنادًا إلى تقنية التعلم المعزز الموسعة - GLM-Zero-Preview. وقد أظهر هذا النموذج قدرات ممتازة في المنطق الرياضي، وكتابة التعليمات البرمجية، واستدلال المشكلات المعقدة، وحقق نتائج مماثلة لنماذج OpenAI المماثلة في تقييمات موثوقة متعددة. لا يعمل GLM-Zero-Preview على تحسين قدرات المهام المتخصصة فحسب، بل يحافظ أيضًا على الأداء الممتاز في المهام العامة، مما يضع معيارًا جديدًا لتحسين قدرات التفكير المنطقي في الذكاء الاصطناعي.
في نهاية العام، أصدرت شركة Beijing Zhipu Huazhang Technology Co., Ltd. أول نموذج استدلال تم تدريبه استنادًا إلى تقنية التعلم المعزز الموسعة - الإصدار الأول من GLM-Zero، GLM-Zero-Preview. يركز هذا النموذج على تحسين قدرات التفكير المنطقي للذكاء الاصطناعي، خاصة في المنطق الرياضي وكتابة التعليمات البرمجية ومعالجة المشكلات المعقدة التي تتطلب تفكيرًا عميقًا. بالمقارنة مع النموذج الأساسي، قام GLM-Zero-Preview بتحسين قدرات المهام المتخصصة بشكل كبير مع الحفاظ على قدرات المهام العامة، كما أن أدائه في تقييمات AIME2024 وMATH500 وLiveCodeBench يعادل معاينة OpenAI o1.
يمكن للمستخدمين الآن تجربة GLM-Zero-Preview مجانًا في وكيل "Zero Inference Model" لمنصة Zhipu Qingyan، وتدعم المنصة تحميل النصوص والصور، وسيقوم النموذج بإخراج عملية الاستدلال الكاملة. وفي الوقت نفسه، يمكن للمطورين أيضًا استدعاء هذا النموذج من خلال واجهة برمجة التطبيقات (API) الخاصة بمنصة Zhipu المفتوحة.
على الرغم من أنه لا تزال هناك فجوة معينة بين نموذج GLM-Zero-Preview ونموذج o3 الخاص بـ OpenAI، تخطط شركة Zhipu Huazhang Technology Co., Ltd. لمواصلة تحسين تكنولوجيا التعلم المعزز التكراري وستطلق قريبًا الإصدار الرسمي من GLM-Zero لتوسيع القدرة من التفكير العميق من المنطق الرياضي إلى مجالات التكنولوجيا الأكثر عمومية.
فيما يتعلق بأداء النموذج، يوضح GLM-Zero-Preview أهمية التعلم المعزز في تعزيز قدرات التفكير العميق للنموذج. مع زيادة مقدار التدريب، تحسن أداء النموذج في جوانب مثل التفكير العميق بشكل مطرد. تم أيضًا التحقق من قانون قياس النموذج في مرحلة الاستدلال، أي أنه مع زيادة عدد الرموز المميزة التي يمكن للنموذج التفكير فيها والحاجة إلى المزيد من الحسابات، فإن جودة النتائج التي يقدمها النموذج تتحسن أيضًا بشكل مطرد. يمكن لـ GLM-Zero-Preview تحقيق عملية صنع القرار بشكل مستقل، وتحليل المشكلات وتجربة طرق متعددة لحل المشكلات أثناء عملية التفكير، والتي تشبه عملية التفكير البشري وصنع القرار.
في حالات الاختبار الفعلية، أظهر GLM-Zero-Preview القدرة على تحديد الثغرات المنطقية ومحاكاة الافتراضات المتعددة من حيث التفكير المنطقي. وفيما يتعلق بالرياضيات، يتمتع النموذج بقدرات استقرائية واستنتاجية قوية، ويمكنه التعامل بسرعة مع العمليات الرياضية المعقدة، وقد وصل إلى مستوى طالب دراسات عليا متميز في اختبار الرياضيات للدراسات العليا لعام 2025. فيما يتعلق بالبرمجة، يمكن لـ GLM-Zero-Preview استخدام لغات برمجة متعددة ببراعة ومساعدة المطورين على كتابة التعليمات البرمجية بسرعة.
طيف الحكمة كلمات واضحة:
https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
منصة Zhipu المفتوحة:
https://bigmodel.cn/dev/api/normal-model/glm-zero-preview
يشير إطلاق GLM-Zero-Preview إلى أن شركة Zhipu Huazhang قد حققت تقدمًا كبيرًا في مجال استدلال الذكاء الاصطناعي، كما تعمل استراتيجيتها الحرة والمفتوحة على تسهيل تجربة المطورين والمستخدمين وملاحظاتهم، مما يوفر بيانات قيمة لتحسين النماذج المستقبلية بشكل متكرر. ونحن نتطلع إلى إصدار النسخة الرسمية من GLM-Zero لتعزيز تقدم تكنولوجيا الذكاء الاصطناعي.