เมื่อเร็วๆ นี้ Yann LeCun ได้แสดงข้อมูลเชิงลึกเกี่ยวกับทิศทางการพัฒนาของ AI ที่ World Economic Forum เขาเน้นย้ำถึงข้อจำกัดของโมเดลกำเนิดปัจจุบันในการประมวลผลวิดีโอ และชี้ให้เห็นว่า AI ในอนาคตจำเป็นต้องทำการคาดการณ์ในพื้นที่นามธรรมมากกว่าพื้นที่พิกเซล สิ่งนี้ได้กระตุ้นให้เกิดการคิดเชิงลึกเกี่ยวกับทิศทางสถาปัตยกรรมและการพัฒนาของโมเดล AI และยังบ่งชี้ว่าการวิจัย AI จะเผชิญกับความท้าทายและโอกาสใหม่ๆ บทความนี้มุ่งเน้นไปที่ปัญหายากๆ ที่พบในการประมวลผลวิดีโอ ตลอดจนวิธีการและเทคโนโลยีใหม่ๆ ที่จำเป็นในการแก้ปัญหาเหล่านี้
Yann LeCun ผู้ชนะรางวัลทัวริงและหัวหน้านักวิทยาศาสตร์ AI ของ Meta ชี้ไปที่ World Economic Forum ว่าแบบจำลองกำเนิดไม่เหมาะสำหรับการประมวลผลวิดีโอ และ AI จำเป็นต้องคาดการณ์ในพื้นที่นามธรรม เนื่องจากข้อมูลข้อความบนอินเทอร์เน็ตหมดลง นักวิจัย AI จึงหันมาสนใจวิดีโอและตระหนักว่าการทำความเข้าใจความสัมพันธ์เชิงสาเหตุมีความสำคัญอย่างยิ่งต่อระบบ AI ในอนาคต ดังนั้นโมเดลใหม่ควรเรียนรู้ที่จะทำนายในพื้นที่การแสดงนามธรรมมากกว่าในพื้นที่พิกเซล ความยากในการประมวลผลวิดีโออยู่ที่ความซับซ้อนของพื้นที่พิกเซล ดังนั้นจึงจำเป็นต้องมีสถาปัตยกรรมใหม่เพื่อประมวลผลอินพุตวิดีโอและทำการคาดการณ์ในพื้นที่การนำเสนอเชิงนามธรรม เพื่อแก้ไขปัญหาที่ยากลำบากในการประมวลผลวิดีโอ จำเป็นต้องสร้างวิธีการและเทคโนโลยีทางวิทยาศาสตร์ใหม่ๆ เพื่อให้ระบบ AI สามารถใช้ข้อมูลได้เช่นเดียวกับมนุษย์มุมมองของ LeCun ชี้ให้เห็นเส้นทางสำหรับการวิจัยในอนาคตในด้าน AI ซึ่งก่อให้เกิดความท้าทายใหม่ๆ ในแง่ของการขาดแคลนข้อมูลและความเข้าใจในสาเหตุ และยังบ่งชี้ว่าเทคโนโลยี AI จะพัฒนาไปในทิศทางที่ชาญฉลาดและเข้าใจมากขึ้น ในอนาคต การก้าวข้ามข้อจำกัดของพื้นที่พิกเซลและการคาดการณ์ในพื้นที่นามธรรมจะกลายเป็นจุดสำคัญในการวิจัยด้าน AI