أطلقت شركة Shanghai Step Star Intelligent Technology Co., Ltd. رسميًا نموذج الاستدلال الذاتي المطور Step Reasoner mini (Step R-mini) في 16 يناير 2025. هذا النموذج هو أول نموذج استدلالي في سلسلة Step. يمكن للمستخدمين تجربة قدرات الاستدلال القوية من خلال صفحة الويب Yuewen. أداء Step R-mini جيد في العديد من المجالات مثل التفكير المنطقي والترميز والرياضيات والإبداع الأدبي، بل إن أدائها في الاختبارات المعيارية المتعددة يتجاوز أداء بعض النماذج المنافسة. وأبرز ما يميز هذا النموذج هو قدرته على مراعاة الكفاءات في الفنون الحرة والعلوم، وهو أمر نادر بين النماذج المماثلة.
في 16 يناير 2025، أعلنت شركة Shanghai Step Reasoner Intelligent Technology Co., Ltd. عن إطلاق نموذج الاستدلال الذاتي الذي طورته Step Reasoner mini ("Step R-mini") رسميًا. يمكن للمستخدمين تسجيل الدخول إلى صفحة ويب Yuewen https://yuewen.cn وتحديد "Step R-mini" في الزاوية اليسرى العليا لتجربتها.
يعد Step R-mini أول نموذج تفكير في عائلة نماذج سلسلة Step، وهو جيد في التخطيط الاستباقي والتجربة والتفكير، ويوفر للمستخدمين استجابات دقيقة وموثوقة من خلال الآلية المنطقية للتفكير البطيء والتحقق المتكرر. لا يمكنها فقط حل المشكلات المعقدة مثل التفكير المنطقي والترميز والرياضيات من خلال قدرات التفكير الطويلة جدًا، ولكنها تأخذ أيضًا في الاعتبار المجالات العامة مثل الإبداع الأدبي.
غطت مصفوفة النموذج الأساسي لسلسلة Step التي طورتها شركة Step Star بشكل مستقل القدرات الشاملة بدءًا من اللغة والطرق المتعددة وحتى التفكير. في الاختبارات المعيارية الرياضية مثل AIME وMath، يتجاوز أداء Step R-mini معاينة o1 ويمكن مقارنته بـ OpenAI o1-mini. كما أنه يؤدي أداءً أفضل من معاينة o1 في مهام تعليمات LiveCodeBench البرمجية. ومن الجدير بالذكر أن معظم نماذج الاستدلال لا يمكنها أن تأخذ في الاعتبار كلاً من الفنون والعلوم، ولكن الخطوة R-mini تحقق "كلاً من الفنون والعلوم" من خلال التدريب على التعلم المعزز على نطاق واسع واستخدام خوارزميات التعلم المعزز على مستوى السياسة " لا يمكنه الإجابة بدقة على أسئلة الرياضيات والبرمجة والتفكير المنطقي فحسب، بل يمكنه أيضًا إكمال إنشاء المحتوى الأدبي ومهام الدردشة اليومية بشكل إبداعي.
في التطبيقات العملية، تظهر الخطوة R-mini نتائج ممتازة. عند حل المشكلات الرياضية، عند مواجهة مشكلات الأولمبياد الرياضي، يمكنه بناء سلسلة منطقية معقولة، وتحقيق التخطيط والحل خطوة بخطوة للمسائل الرياضية المعقدة، وتعداد الحلول المختلفة للتحقق من الصحة. عند التعامل مع المشكلات الهندسية، يمكنك إنشاء وسائط محتوى للتفكير المتعمق من خلال الرسم. في مهام التفكير المنطقي، جرب بشكل مستقل مجموعة متنوعة من أفكار حل المشكلات واطرح على نفسك الأسئلة للتأكد من تعداد جميع الحلول الجيدة. فيما يتعلق بأسئلة البرمجة، يمكنك الإجابة بشكل صحيح على أسئلة الخوارزمية بتصنيف صعوبة "صعب" على النظام الأساسي للتكنولوجيا LeetCode، ويمكنك أيضًا التعامل مع متطلبات التطوير المعقدة، وتحليل احتياجات المستخدم ونواياه تدريجيًا، وبناء منطق التعليمات البرمجية. فيما يتعلق بإنشاء المحتوى، يمكنك فهم احتياجات المستخدمين للتعبير بعمق، وتحليل الموضوعات الإبداعية والموضوعات الأدبية وغيرها من المتطلبات، والتفكير في الزوايا الإبداعية، وتصوير المشاهد، والتقنيات البلاغية، وبنية المحتوى، وإعطاء الأشياء معنى رمزيًا على المستوى العاطفي الإنساني وإضافة عناصر مخصصة ومبتكرة. عندما يتعلق الأمر بقضايا الترجمة، فإننا نتبع مبدأ "الإخلاص والأناقة والأناقة" ونسعى جاهدين لتقديم نتائج ترجمة دقيقة وذات معنى.
بالإضافة إلى نماذج الاستدلال اللغوي، تقوم شركة Step Star أيضًا ببناء نموذج استدلال بصري لدمج قدرات الاستدلال في نماذج كبيرة بأشكال أكثر تفاعلية. بهدف حل مشكلة الاستدلال في المشاهد المرئية المعقدة، تم تقديم أفكار الإدراك البطيء والتفكير المكاني لنقل مقياس وقت الاختبار من مساحة النص إلى المساحة المرئية لتحقيق التفكير المكاني البطيء في المساحة المرئية. في الوقت الحاضر، حقق نموذج الاستدلال البصري نتائج أولية، ومن المتوقع أن يتم إصدار النسخة الرسمية للجميع هذا العام.
يمثل إطلاق Step R-mini إنجازًا كبيرًا لشركة Step Star في مجال الذكاء الاصطناعي، وهي تستحق التطلع إلى قدراتها المنطقية القوية وإمكاناتها التطبيقية المتعددة المجالات. في المستقبل، سنستمر في الاهتمام بمواصلة تطوير Step Star في مجال الذكاء الاصطناعي.