أعلنت شركة Beijing Dark Side of the Moon Technology Co., Ltd. مؤخرًا أن مساعدها الذكي Kimi قد تلقى ترقية كبيرة وأطلق نموذج التفكير متعدد الوسائط k1.5. يتفوق هذا النموذج على العديد من النماذج العالمية الرائدة بما في ذلك GPT-4o وClaude3.5Sonnet في قدرات الاستدلال متعدد الوسائط وقدرات الاستدلال العام، مما يحقق أداء الاستدلال متعدد الوسائط للإصدار الرسمي من o1 لأول مرة من قبل شركة أخرى غير OpenAI. يمثل هذا الاختراق التقدم الكبير الذي حققه كيمي في مجال الذكاء الاصطناعي، والابتكار التكنولوجي والجهود الجماعية التي تقف وراءه تستحق الاهتمام. لا تعمل هذه الترقية على تحسين قدرات المعالجة الرياضية والرمزية والمرئية متعددة الوسائط لدى Kimi فحسب، بل تعمل أيضًا على تحسين قدرات التفكير العميق للنموذج بشكل كبير من خلال توسيع السياق الطويل وأساليب تحسين الإستراتيجية المحسنة، مما يوفر للمستخدمين دعمًا قويًا لحل المشكلات المعقدة.
في الآونة الأخيرة، أعلنت شركة Beijing Dark Side of the Moon Technology Co., Ltd. أن مساعدها الذكي Kimi قد تلقى ترقية تكنولوجية كبيرة وأطلق نموذجًا جديدًا للتفكير متعدد الوسائط k1.5. وقد وصل هذا النموذج إلى مستويات رائدة في الصناعة في مجال التفكير متعدد الوسائط وقدرات التفكير العام، مما يمثل اختراقًا آخر لكيمي في مجال الذكاء الاصطناعي.
يعد نموذج التفكير متعدد الوسائط k1.5 هو الترقية الرئيسية الثالثة لشركة Kimi لنموذج التعلم المعزز من سلسلة k خلال ثلاثة أشهر فقط. بعد النموذج الرياضي k0-math الذي تم إصداره في نوفمبر من العام الماضي ونموذج التفكير البصري k1 الذي تم إصداره في ديسمبر، كان أداء نموذج k1.5 متميزًا في الاختبارات المعيارية. في وضع CoT القصير، تجاوزت الرياضيات والتشفير والقدرات البصرية المتعددة الوسائط والقدرات العامة لـ k1.5 بشكل كبير مستويات نماذج SOTA العالمية ذات التفكير القصير GPT-4o وClaude3.5Sonnet، مع تقدم يصل إلى 550%. في وضع Long-CoT، وصلت أيضًا قدرات الرياضيات والأكواد والتفكير متعدد الوسائط لـ k1.5 إلى مستوى الإصدار الرسمي من نموذج Longthink SOTA OpenAI o1. وهذه هي المرة الأولى في العالم التي تحققها شركة أخرى غير OpenAI النسخة الرسمية من o1 لأداء التفكير متعدد الوسائط.
تكمن وراء هذه الترقية الجهود المتواصلة والابتكار الذي يبذله فريق كيمي الفني. ولأول مرة، نشر الفريق تقريرًا مفصلاً عن تكنولوجيا التدريب النموذجي "Kimi k1.5: التوسع لتحقيق التعلم المعزز بمساعدة نماذج اللغة الكبيرة"، مسجلاً استكشاف التدريب النموذجي في ظل نموذج التكنولوجيا الجديد.
وأشار التقرير إلى أن الابتكارات الرئيسية لنموذج k1.5 تشمل توسيع السياق الطويل، مما يحسن كفاءة التدريب من خلال تقنية التوسع الجزئي. ويلاحظ أيضًا أن الزيادة في طول السياق يمكن أن تستمر في تحسين أداء النموذج. بالإضافة إلى ذلك، توفر أساليب تحسين الإستراتيجية المحسنة وتصميم الإطار الموجز الدعم للأداء القوي للنموذج. ومن الجدير بالذكر أن نموذج k1.5 تم تدريبه بشكل مشترك على البيانات النصية والمرئية، ولديه القدرة على التفكير المشترك بين الطريقتين. وهو يؤدي أداءً جيدًا بشكل خاص في القدرات الرياضية، على الرغم من صعوبة التعامل مع مشاكل الرسومات الهندسية تعتمد جزئيا على فهم الرسم لا تزال هناك تحديات.
من أجل زيادة تحسين القدرة على التفكير في السلسلة القصيرة، اقترح الفريق أيضًا طريقة طويلة 2 قصيرة فعالة، باستخدام تقنية Long-CoT لتحسين نموذج Short-CoT، وحقق نتائج ملحوظة في اختبارات مثل AIME وMATH500 وLiveCodeBench، بشكل ملحوظ تجاوز أساليب التفكير القائمة على السلسلة القصيرة، مثل GPT-4 وClaude Sonnet3.5.
سيتم إطلاق نسخة المعاينة لنموذج التفكير متعدد الوسائط k1.5 بالتدرج الرمادي على موقع Kimi.com وأحدث إصدار من تطبيق Kimi Smart Assistant. إذا وجد المستخدمون زر تبديل النموذج أثناء الاستخدام، فيمكنهم تجربة هذا النموذج الذي تمت ترقيته حديثًا. يعد نموذج k1.5 جيدًا في التفكير العميق ويمكنه مساعدة المستخدمين على حل مشكلات التعليمات البرمجية المعقدة والمشكلات الرياضية ومشكلات العمل.
ذكرت شركة Dark Side of the Moon Technology Co., Ltd. أنها ستواصل تسريع ترقية نماذج التعلم المعزز من سلسلة k على طول خريطة الطريق الموضوعة في عام 2025، مما يوفر المزيد من الأساليب والقدرات في المزيد من المجالات وقدرات عامة أقوى، ويفتح المزيد لإمكانية المستخدمين.
رابط تقرير جيثب: https://github.com/MoonshotAI/kimi-k1.5
تُظهر ترقية طراز Kimi k1.5 قدرات الابتكار المستمر التي تتمتع بها شركة Dark Side of the Moon Technology في مجال الذكاء الاصطناعي، كما أن مستوى التكنولوجيا الرائد وخطط التطوير المستقبلية تستحق التطلع إليها. أعتقد أن Kimi سيجلب تجربة ذكية أكثر قوة للمستخدمين في المستقبل.