Tencent AI Lab และทีม Chinese University of Hong Kong ร่วมมือกันพัฒนา UniRepLKNet ซึ่งเป็นโมเดลหลายรูปแบบที่อิงจาก CNN ที่มีคอร์ขนาดใหญ่ โดยมีเป้าหมายที่จะท้าทายการครอบงำของ Transformer ในสาขาหลายรูปแบบ โมเดลนี้ทำงานได้ดีในการประมวลผลพอยต์คลาวด์ ข้อมูลเสียงและวิดีโอ ฯลฯ ข้อดีของมันคือสามารถปรับให้เข้ากับประเภทข้อมูลที่แตกต่างกันได้โดยไม่ต้องเปลี่ยนโครงสร้างของโมเดล UniRepLKNet เหนือกว่ารุ่น Transformer ในการทดสอบเกณฑ์มาตรฐาน เช่น ImageNet, COCO และ ADE20K ซึ่งพิสูจน์ให้เห็นถึงศักยภาพมหาศาลของ CNN แบบคอร์ขนาดใหญ่ในแอปพลิเคชันแบบหลายรูปแบบ และให้ทิศทางและแนวคิดใหม่สำหรับการวิจัยแบบหลายรูปแบบ
Tencent AI Lab ร่วมมือกับทีมงานชาวจีนฮ่องกงในการเปิดตัว UniRepLKNet เพื่อท้าทายการครอบงำของ Transformer ในด้านมัลติโมดัล สถาปัตยกรรม CNN แบบคอร์ขนาดใหญ่นี้ทำงานได้ดีบนพอยต์คลาวด์ เสียง วิดีโอ และงานอื่นๆ โดยไม่ต้องเปลี่ยนโครงสร้างของโมเดล UniRepLKNet เหนือกว่า Transformer ในงานต่างๆ เช่น ImageNet, COCO และ ADE20K ซึ่งแสดงให้เห็นถึงศักยภาพของ CNN ที่มีคอร์ขนาดใหญ่ในแอปพลิเคชันหลายรูปแบบ
ความสำเร็จของ UniRepLKNet แสดงให้เห็นว่าสถาปัตยกรรม CNN แบบคอร์ขนาดใหญ่มีความสามารถในการแข่งขันในงานแบบหลายรูปแบบ และให้แนวคิดใหม่ๆ สำหรับการออกแบบโมเดลแบบหลายรูปแบบในอนาคต คุณลักษณะที่ไม่จำเป็นต้องเปลี่ยนโครงสร้างโมเดลยังทำให้การประยุกต์ใช้โมเดลง่ายขึ้นและปรับปรุงประสิทธิภาพการพัฒนาอีกด้วย ผลการวิจัยนี้ได้นำความก้าวหน้าใหม่ๆ มาสู่การวิจัยหลายรูปแบบในสาขาปัญญาประดิษฐ์ และสมควรได้รับความสนใจและการวิจัยเชิงลึกเพิ่มเติม