أصدرت شركة Dark Side of the Moon اليوم نموذجًا جديدًا للتفكير البصري k1، والذي يعتمد على تقنية التعلم المعزز وقد حقق اختراقات كبيرة في فهم الصور واستدلالها. لا يدعم نموذج k1 الفهم الشامل للصور فحسب، بل يدمج أيضًا تكنولوجيا سلسلة التفكير، ويوسع نطاق تطبيقه ليشمل مجالات العلوم الأساسية مثل الفيزياء والكيمياء، ويتجاوز النماذج الرائدة في العالم في اختبارات قياس الأداء المتعددة. ويكمن ابتكارها في التكامل بين فهم الصورة والقدرة على التفكير، حيث يمكن للمستخدمين إدخال معلومات الصورة مباشرة والحصول على الإجابات دون اللجوء إلى أدوات خارجية، مما يحسن بشكل كبير من كفاءة التفاعل وتجربة المستخدم.
أعلن Dark Side of the Moon اليوم عن إطلاق نموذج جديد للتفكير البصري k1. يعتمد هذا النموذج على تقنية التعلم المعزز، التي لا تدعم فهم الصور الشامل فحسب، بل تدمج أيضًا تقنية سلسلة التفكير، وتوسع قدراتها لتشمل المزيد من مجالات العلوم الأساسية إلى جانب الرياضيات، بما في ذلك الفيزياء والكيمياء. وفي اختبار القدرة المعيارية، تفوق طراز k1 في الأداء على النماذج القياسية الرائدة في العالم، مثل OpenAI's o1 وGPT-4o وClaude3.5Sonnet.
يحفز نموذج الجيل الجديد توليد خطوات تفكير أكثر تفصيلاً لتشكيل سلسلة تفكير عالية الجودة، مما يحسن بشكل كبير معدل نجاح حل المهام المعقدة. يوفر دمج نموذج Kimi's k1 في فهم الصور وقدرات التفكير للمستخدمين تجربة تفاعلية أكثر سلاسة، ويمكنه معالجة معلومات الصورة المدخلة من قبل المستخدم مباشرة والحصول على الإجابات دون اللجوء إلى التعرف الضوئي على الحروف الخارجي أو النماذج المرئية الإضافية.
وينقسم تدريب نموذج k1 إلى مرحلتين، أولا، يتم الحصول على النموذج الأساسي من خلال التدريب المسبق، ومن ثم يتم تنفيذ التدريب اللاحق من خلال التعلم المعزز على هذا الأساس. حقق النموذج الأساسي درجة ممتازة قدرها 903 على OCRBench وكان أداؤه متميزًا في معايير MathVista-testmini وMMMU-val وDocVQA. تم تحسين التدريب على التعلم بعد التعزيز من حيث جودة البيانات وكفاءة التعلم، مما يحقق اختراقات جديدة على نطاق واسع.
قام كيمي أيضًا بشكل مستقل ببناء مجموعة اختبار موحدة، Science Vista، تغطي أسئلة مصورة رياضية وفيزيائية وكيميائية متفاوتة الصعوبة، وستكون مفتوحة للصناعة بأكملها. على الرغم من أن نموذج k1 أظهر بعض القيود في الاختبارات الداخلية، مثل مجال التحسين في التعميم خارج التوزيع ومعدل النجاح في المشكلات المعقدة، إلا أن أدائه في مشاهد الضوضاء المرئية أفضل من النماذج الأخرى، مما يُظهر قدرة فائقة على التعرف البصري.
لا يؤدي نموذج التفكير البصري k1 الخاص بالمساعد الذكي Kimi أداءً جيدًا في مجال الرياضيات فحسب، بل يمتد أيضًا إلى مجالات الفيزياء والكيمياء، مما يوضح مجموعة واسعة من القدرات العلمية الأساسية. بالإضافة إلى ذلك، أظهر نموذج k1 قدرة عامة على التفسير والتفسير بشأن المشكلات غير الرياضية، مثل المحتوى والخلفية الدرامية لمخطوطة أحد العلماء.
يتطلع Kimi Smart Assistant إلى استكشاف عالم أكبر مع المستخدمين، وقد تم إطلاق طراز k1 الجديد. ويمكن للمستخدمين تجربة هذه الميزة الجديدة من خلال أحدث إصدار من تطبيق Kimi Smart Assistant للهاتف المحمول أو إصدار الويب.
لقد حقق نموذج Kimi k1 أداءً جيدًا في العديد من الاختبارات المعيارية، مما يدل على قدرته القوية على التفكير البصري وآفاق التطبيق الواسعة. على الرغم من أنه لا تزال هناك بعض المجالات التي تحتاج إلى تحسين، إلا أن اختراقاتها في التعرف على الصور والإجابة على الأسئلة العلمية ستجلب بلا شك زخمًا تنمويًا جديدًا في مجال الذكاء الاصطناعي. نرحب بالمستخدمين لتجربة التجربة التفاعلية الجديدة التي يقدمها طراز k1!