أصدرت Alibaba Cloud مؤخرًا نموذجها المرئي الجديد لنموذج Tongyi Qianwen Big - Qwen2.5 -VL ، وفتحت مصادر إصداراتها الثلاثة المختلفة من 3B و 7B و 72B. تمثل هذه الخطوة اختراقًا كبيرًا في مجال رؤية الذكاء الاصطناعي . QWEN2.5-VL ليس فقط إمكانات فهم للصور ، ولكنها تدعم أيضًا أكثر من ساعة من فهم الفيديو. الاشتراك.
فتحت Alibaba Cloud Tongyi Qianwen مصادر النموذج البصري الجديد QWEN2.5-VL ، وأطلقت ثلاثة إصدارات في 3B و 7B و 72B.
من بينها ، فازت Qwen2.5-VL-72B الرائدة ببطولة الفهم البصري في 13 مراجعة موثوقة ، متجاوزة GPT-4O و Claude3.5. قدمت Alibaba Cloud رسميًا أن QWEN2.5-VL الجديد يمكنه تحليل محتوى الصورة بشكل أكثر دقة ودعم أكثر من ساعة واحدة من فهم الفيديو. يمكن لهذا النموذج البحث عن أحداث محددة في الفيديو وتلخيص النقاط الرئيسية لفترات زمنية مختلفة من الفيديو ، وبالتالي مساعدة المستخدمين بسرعة وكفاءة على استخراج المعلومات الرئيسية من الفيديو.
بالإضافة إلى ذلك ، يمكن تحويل QWEN2.5-VL إلى عوامل مرئية يمكنها التحكم في الهواتف المحمولة وأجهزة الكمبيوتر دون ضبطها ، وتحقيق عمليات متعددة الخطوات ومعقدة ، مثل إرسال البركات إلى الأصدقاء المعينين ، وتحرير صور الكمبيوتر ، وتذكرة الهاتف المحمول الحجز انتظر. QWEN2.5-VL ليس جيدًا فقط في تحديد الكائنات الشائعة ، مثل الزهور والطيور والأسماك والحشرات ، ولكن أيضًا يحلل النص ، والمخططات ، والرموز ، والرسومات ، والتخطيطات في الصور. قامت Alibaba Cloud أيضًا بتحسين إمكانات التعرف على OCR لـ QWEN2.5-VL ، وعززت إمكانيات التعرف على النص المتعددة والمتعددة اللغات والمتعددة الاتجاهات.
في الوقت نفسه ، تم تعزيز قدرة استخراج المعلومات بشكل كبير لتلبية الاحتياجات الرقمية والذكاء المتنامية لمراجعة المؤهلات والتمويل والتجارة.
نقاط:
Alibaba Cloud Tongyi Qianwen Open Source Qwen2.5-VL ، حيث أطلق ثلاثة إصدارات من 3B و 7B و 72B.
QWEN2.5-VL-72B يتجاوز GPT-4O و CLAUDE3.5 في تقييم الفهم البصري.
QWEN2.5-VL يدعم فهم الفيديو على مدى ساعة واحدة ويعزز إمكانيات التعرف على الحروف التعرف على الحروف.
سوف يعزز المصدر المفتوح لـ QWEN2.5-VL بشكل كبير تطوير رؤية الذكاء الاصطناعي ويوفر المزيد من الاحتمالات للتطبيقات المبتكرة لجميع مناحي الحياة. إن أدائها القوي وآفاق التطبيق الواسعة سيعزز بلا شك المزيد من التطوير والتعميم لتكنولوجيا الذكاء الاصطناعي.