في السنوات الأخيرة، حقق التعلم العميق تقدمًا كبيرًا في مجال مطابقة الصور، لكن تعميم النموذج لا يزال يمثل تحديًا. من أجل حل هذه المشكلة، اقترح باحثون من جامعة Xiamen وIntel وDJI طريقة جديدة: GIM (تعلم مطابقة الصور القابلة للتعميم من مقاطع الفيديو عبر الإنترنت). يهدف هذا البحث إلى تحسين قدرة التعميم لنماذج مطابقة الصور حتى تتمكن من التكيف بشكل أفضل مع السيناريوهات والبيانات المختلفة. يستخدم GIM مقاطع فيديو عبر الإنترنت للتدريب ويقترح معيار تقييم Zero-shot (ZEB) لأول مرة لتقييم الأداء العام للنموذج. ومن المتوقع أن تؤدي هذه الطريقة إلى تحسين التطبيق العملي وموثوقية تقنية مطابقة الصور بشكل كبير وتحقيق اختراقات جديدة في مجال رؤية الكمبيوتر.
تعد مطابقة الصور مهمة أساسية للرؤية الحاسوبية، وفي السنوات الأخيرة، أصبحت نماذج المطابقة القائمة على التعلم العميق شائعة بشكل متزايد. من أجل حل مشكلة تعميم أساليب التعلم العميق، اقترح باحثون من جامعة Xiamen وIntel وDJI GIM: تعلم مطابقة الصور القابلة للتعميم من مقاطع الفيديو عبر الإنترنت. يسمح GIM للنماذج المطابقة بتعلم قدرات التعميم القوية من مقاطع الفيديو على الإنترنت، وهو مناسب لتدريب جميع النماذج المطابقة. اقترح المؤلف أول معيار تقييم Zero-shot (ZEB). أظهرت نتائج التقييم أن GIM يمكنه تحسين أداء التعميم للنموذج المطابق بشكل كبير.
يوفر ظهور GIM أفكارًا جديدة لتحسين قدرة التعميم لنماذج مطابقة الصور، كما يثبت أدائها الممتاز على معيار تقييم Zero-shot فعاليته أيضًا. تعتبر نتيجة البحث هذه ذات أهمية كبيرة في تعزيز التقدم وتطبيق تكنولوجيا مطابقة الصور وتستحق المزيد من الاهتمام والبحث.