โมเดลการให้เหตุผลหลายรูปแบบ QVQ-72B ที่เพิ่งเปิดตัวใหม่ของอาลีบาบาสร้างขึ้นจาก Qwen2-VL-72B และแสดงให้เห็นประสิทธิภาพที่ยอดเยี่ยมในด้านการใช้เหตุผลเชิงภาพ คณิตศาสตร์ และปัญหาทางวิทยาศาสตร์ สามารถหลอมรวมภาษาและข้อมูลภาพ ดำเนินการหาเหตุผลหลายขั้นตอน และแก้ปัญหาที่ซับซ้อน โดยเฉพาะอย่างยิ่งในการได้มาซึ่งความสัมพันธ์เชิงสาเหตุในปัญหาทางกายภาพและการให้เหตุผลทางคณิตศาสตร์ที่ซับซ้อน ซึ่งช่วยลดอัตราข้อผิดพลาดได้อย่างมากและให้ขั้นตอนการแก้ปัญหาที่ชัดเจน QVQ-72B ยังแสดงให้เห็นถึงความสามารถที่มีประสิทธิภาพและแม่นยำในการดึงข้อมูลสำคัญในการประมวลผลรายงานทางเทคนิคและการวิเคราะห์แผนภูมิที่ซับซ้อน และมีความสามารถในการจดจำรายละเอียดภาพที่แม่นยำ สามารถนำไปใช้กับสาขาต่างๆ เช่น การตรวจสอบอัจฉริยะและการขับขี่อัตโนมัติ
QVQ-72B ได้สร้างความก้าวหน้าครั้งสำคัญในด้าน AI หลายรูปแบบ ความสามารถในการให้เหตุผลอันทรงพลังของมันมอบแนวคิดและเครื่องมือใหม่ๆ ในการแก้ปัญหาที่ซับซ้อน ทำให้เกิดแรงผลักดันใหม่ในการยกระดับความชาญฉลาดของอุตสาหกรรมต่างๆ ลิงก์การทดลองใช้ออนไลน์และการแนะนำโดยละเอียดอยู่ที่: https://huggingface.co/spaces/Qwen/QVQ-72B-preview และ https://qwenlm.github.io/blog/qvq-72b-preview/ เชื่อกันว่าการเกิดขึ้นของ QVQ-72B จะส่งเสริมการประยุกต์ใช้และพัฒนาเทคโนโลยีปัญญาประดิษฐ์ในสาขาอื่นๆ มากขึ้น