تعاون Tencent AI Lab وفريق جامعة هونغ كونغ الصينية لتطوير UniRepLKNet، وهو نموذج متعدد الوسائط يعتمد على شبكة CNN كبيرة النواة، بهدف تحدي هيمنة Transformer في المجال متعدد الوسائط. يعمل النموذج جيدًا في معالجة السحابة النقطية وبيانات الصوت والفيديو وما إلى ذلك. وتتمثل ميزته في أنه يمكنه التكيف مع أنواع البيانات المختلفة دون تغيير بنية النموذج. لقد تجاوزت UniRepLKNet نموذج Transformer في الاختبارات المعيارية مثل ImageNet وCOCO وADE20K، مما أثبت الإمكانات الهائلة لشبكة CNN كبيرة النواة في التطبيقات متعددة الوسائط وتوفير اتجاهات وأفكار جديدة للبحث متعدد الوسائط.
تعاونت Tencent AI Lab مع فريق هونج كونج الصيني لإطلاق UniRepLKNet لتحدي هيمنة Transformer في المجال متعدد الوسائط. تعمل بنية CNN كبيرة النواة بشكل جيد على السحابة النقطية والصوت والفيديو والمهام الأخرى دون تغيير بنية النموذج. تفوقت UniRepLKNet على Transformer في مهام مثل ImageNet وCOCO وADE20K، مما يدل على إمكانات CNN كبيرة النواة في التطبيقات متعددة الوسائط.
يُظهر نجاح UniRepLKNet أن بنية CNN كبيرة النواة قادرة على المنافسة في المهام متعددة الوسائط وتوفر أفكارًا جديدة لتصميم النماذج المستقبلية متعددة الوسائط. كما أن ميزة عدم الحاجة إلى تغيير بنية النموذج تعمل أيضًا على تبسيط تطبيق النموذج وتحسين كفاءة التطوير. لقد أحدثت نتيجة البحث هذه اختراقات جديدة في الأبحاث متعددة الوسائط في مجال الذكاء الاصطناعي وتستحق المزيد من الاهتمام والبحث المتعمق.