تم تصميم نموذج الاستدلال متعدد الوسائط QVQ-72B الذي تم إصداره حديثًا من علي بابا استنادًا إلى Qwen2-VL-72B ويظهر أداءً ممتازًا في الاستدلال البصري والرياضيات والمسائل العلمية. يمكنه دمج اللغة والمعلومات المرئية، وإجراء تفكير متعدد الخطوات، وحل المشكلات المعقدة، وهو متميز بشكل خاص في اشتقاق العلاقات السببية في المشكلات الفيزيائية والتفكير الرياضي المعقد، مما يقلل بشكل كبير من معدل الخطأ ويوفر خطوات واضحة لحل المشكلات. يُظهر QVQ-72B أيضًا قدرة فعالة ودقيقة على استخراج المعلومات الأساسية في معالجة التقارير الفنية وتحليل الرسوم البيانية المعقدة، كما يتمتع بقدرات دقيقة للتعرف على تفاصيل الصور ويمكن تطبيقه في مجالات مثل المراقبة الذكية والقيادة الذاتية.
حقق QVQ-72B تقدمًا كبيرًا في مجال الذكاء الاصطناعي متعدد الوسائط، حيث توفر قدراته المنطقية القوية أفكارًا وأدوات جديدة لحل المشكلات المعقدة، وضخ زخم جديد في الترقية الذكية لمختلف الصناعات. الروابط التجريبية والمقدمة التفصيلية عبر الإنترنت هي: https://huggingface.co/spaces/Qwen/QVQ-72B-preview وhttps://qwenlm.github.io/blog/qvq-72b-preview/. ويعتقد أن ظهور QVQ-72B سيعزز تطبيق وتطوير تكنولوجيا الذكاء الاصطناعي في المزيد من المجالات.