تطلق DeepSeek أول نموذج استدلالي لها R1-Lite-Preview، والذي يفوق أداؤه OpenAI o1 - مقالة حول الذكاء الاصطناعي

الكاتب：Eve Cole وقت التحديث：2025-01-26 02:00:01

أصدرت DeepSeek، وهي شركة تابعة لشركة Huifang Quantitative الصينية العملاقة للاستثمار الكمي، مؤخرًا أحدث نموذج لغوي واسع النطاق يركز على الاستدلال وهو R1-Lite-Preview. هذا النموذج متاح حاليًا للجمهور فقط من خلال منصة chatbot على الويب DeepSeek Chat. يستخدم R1-Lite-Preview منطق "التفكير المتسلسل"، والذي يمكن أن يُظهر عملية التفكير التي يمر بها عند الإجابة على استفسارات المستخدم. حتى لو بدت بعض سلاسل التفكير غير منطقية، فإن دقة إجابتها الإجمالية عالية جدًا، ويمكنها أيضًا حل بعض المشكلات التقليدية المشكلات التي يصعب على نماذج الذكاء الاصطناعي القوية التعامل معها. لقد تجاوز النموذج نموذج معاينة o1 الذي تم إصداره مؤخرًا من OpenAI في العديد من الاختبارات المعيارية، وكان أداؤه ممتازًا في المهام التي تتطلب التفكير المنطقي والتفكير الرياضي وحل المشكلات في الوقت الفعلي.

تشتهر DeepSeek بمساهماتها المبتكرة في النظام البيئي للذكاء الاصطناعي مفتوح المصدر، ويهدف هذا الإصدار الجديد إلى توفير قدرات استدلال عالية المستوى للجمهور مع الحفاظ على الالتزام بإمكانية الوصول والشفافية. على الرغم من أن R1-Lite-Preview متاح حاليًا فقط في تطبيقات الدردشة، إلا أنه قد جذب الكثير من الاهتمام بأداء قريب أو حتى يتجاوز نموذج o1-preview الذي تم إصداره مؤخرًا من OpenAI. يستخدم R1-Lite-Preview منطق "التفكير المتسلسل"، والذي يمكنه إظهار عمليات التفكير المختلفة التي يمر بها عند الرد على استعلامات المستخدم.

على الرغم من أن بعض سلاسل التفكير قد تبدو غير منطقية أو خاطئة بالنسبة للبشر، إلا أن إجابات R1-Lite-Preview دقيقة للغاية ويمكنها أيضًا حل "الفخاخ" التي تواجهها بعض نماذج الذكاء الاصطناعي القوية التقليدية مثل GPT-4o وسلسلة Claude "الأسئلة،". مثل كم عدد حروف R في كلمة "فراولة"؟ "أيهما أكبر، 9.11 أم 9.9؟"

وفقًا لـ DeepSeek، يتفوق النموذج في المهام التي تتطلب التفكير المنطقي والتفكير الرياضي وحل المشكلات في الوقت الفعلي. ويتجاوز أدائه مستوى معاينة OpenAI o1 وفقًا للمعايير المحددة مثل AIME (اختبار الرياضيات الدعوي الأمريكي) وMATH.

بالإضافة إلى ذلك، أصدرت DeepSeek بيانات موسعة للنموذج، مما يدل على تحسن ثابت في الدقة عندما يتم منح النموذج المزيد من الوقت، أو "رموز التفكير" لحل المشكلة. يسلط الرسم البياني الضوء على أنه مع زيادة عمق التفكير، تتحسن نتيجة النموذج في معايير مثل AIME.

يعمل الإصدار الحالي من R1-Lite-Preview بشكل جيد في المعايير الرئيسية، وهو قادر على التعامل مع مجموعة من المهام بدءًا من الرياضيات المعقدة وحتى السيناريوهات المنطقية، مع نتائج مماثلة لأفضل نماذج الاستدلال مثل GPQA وCodeforces. تتيح عملية الاستدلال الشفافة للنموذج للمستخدمين مراقبة خطواته المنطقية في الوقت الفعلي، مما يعزز إحساس النظام بالمسؤولية والمصداقية.

تجدر الإشارة إلى أن DeepSeek لم تصدر الكود الكامل للتحليل أو قياس الأداء المستقل لجهة خارجية، ولم توفر واجهة API للاختبار المستقل. ولم تصدر الشركة منشورات مدونة ذات صلة أو مستندات فنية تشرح التدريب أو اختبار R1 - بنية Lite-Preview، مما يجعل الأصل الكامن وراءها لا يزال مليئًا بالشكوك.

يتوفر R1-Lite-Preview حاليًا مجانًا عبر DeepSeek Chat (chat.deepseek.com)، ولكن وضعه "العميق" المتقدم يقتصر على 50 رسالة يوميًا، مما يسمح للمستخدمين بتجربة إمكاناته القوية. تخطط DeepSeek لإصدار إصدارات مفتوحة المصدر من نماذج سلسلة R1 وواجهات برمجة التطبيقات ذات الصلة لمزيد من الدعم لتطوير مجتمع الذكاء الاصطناعي مفتوح المصدر.

يستمر DeepSeek في دفع الابتكار في مجال الذكاء الاصطناعي مفتوح المصدر، ويضيف إصدار R1-Lite-Preview بعدًا جديدًا لاستدلاله وقابلية التوسع. وبينما تستكشف الشركات والباحثون تطبيقات الذكاء الاصطناعي المعتمد على الاستدلال المكثف، فإن التزام DeepSeek بالانفتاح سيضمن أن تصبح نماذجها مورداً مهماً للتنمية والابتكار.

المدخل الرسمي: https://www.deepseek.com/

تسليط الضوء على:

أصدرت DeepSeek نموذج R1-Lite-Preview، الذي يقترب أداءه من OpenAI o1 ويتفوق عليه.

يعرض النموذج عملية تفكير شفافة، ويمكن للمستخدمين ملاحظة الخطوات المنطقية في الوقت الفعلي.

يتمتع بقدرات رائعة على التعلم العميق والتفكير المنطقي، وسيتم إصدار إصدار مفتوح المصدر وواجهة برمجة التطبيقات (API) في المستقبل.

بشكل عام، يُظهر نموذج R1-Lite-Preview الذي أصدرته DeepSeek مزايا كبيرة في قدرات الاستدلال، كما أن عملية الاستدلال الشفافة والخطط المستقبلية مفتوحة المصدر تستحق التطلع إليها أيضًا. ومع ذلك، فإن النقص الحالي في القانون العام والوثائق الفنية يحد من إجراء تقييم شامل لأدائها.