ทีมวิจัยที่มหาวิทยาลัยนิวยอร์กและ UC Berkeley มีความก้าวหน้าอย่างมากในด้านแบบจำลองภาษาขนาดใหญ่แบบหลายรูปแบบ พวกเขาค้นพบข้อบกพร่องที่สำคัญในโมเดลที่มีอยู่ในด้านความเข้าใจด้วยภาพ และเสนอวิธี "Interleaved Feature Mixing (Interleaved-MoF)" อย่างสร้างสรรค์ เทคโนโลยีที่ก้าวล้ำนี้ปรับปรุงความสามารถด้านการมองเห็นขั้นพื้นฐานของโมเดลขนาดใหญ่หลายรูปแบบได้อย่างมีประสิทธิภาพ โดยได้รับการปรับปรุงประสิทธิภาพอย่างมีนัยสำคัญถึง 10.7% ในการทดสอบเกณฑ์มาตรฐาน MMVP ซึ่งชี้ให้เห็นทิศทางใหม่สำหรับการพัฒนาเทคโนโลยีปัญญาประดิษฐ์หลายรูปแบบในอนาคต และยัง มอบประสบการณ์อันมีค่าและแรงบันดาลใจสำหรับการวิจัยในสาขานี้
เมื่อเร็วๆ นี้ ทีมวิจัยจากมหาวิทยาลัยนิวยอร์กและ UC Berkeley ได้สร้างความก้าวหน้าครั้งสำคัญในด้านแบบจำลองภาษาขนาดใหญ่แบบหลายรูปแบบ และประสบความสำเร็จในการค้นพบข้อบกพร่องที่สำคัญในการทำความเข้าใจแบบจำลองที่มีอยู่ด้วยภาพ เพื่อตอบสนองต่อปัญหานี้ ทีมวิจัยได้เสนอวิธี "Interleaved Feature Mixing (Interleaved-MoF)" ซึ่งประสบความสำเร็จในการปรับปรุงความสามารถด้านการมองเห็นขั้นพื้นฐานของโมเดลขนาดใหญ่หลายรูปแบบ และได้รับการเพิ่มประสิทธิภาพความสามารถ 10.7% ในเกณฑ์มาตรฐาน MMVP งานวิจัยนี้เป็นแรงบันดาลใจที่เป็นประโยชน์สำหรับการพัฒนาเทคโนโลยี AI หลายรูปแบบในอนาคต
ผลการวิจัยนี้ไม่เพียงแต่แก้ปัญหาคอขวดในการทำความเข้าใจแบบจำลองขนาดใหญ่หลายรูปแบบเท่านั้น แต่ยังให้แนวคิดและวิธีการใหม่ ๆ สำหรับการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ในอนาคต สมควรได้รับการศึกษาเชิงลึกและอ้างอิงโดยนักวิจัยในสาขาที่เกี่ยวข้อง เราตั้งตารอถึงอนาคต ดูนวัตกรรมเพิ่มเติมจากการวิจัยที่เกิดขึ้นนี้