أعرب يان ليكون مؤخرًا عن رؤيته حول اتجاه تطوير الذكاء الاصطناعي في المنتدى الاقتصادي العالمي، وشدد على القيود المفروضة على النماذج التوليدية الحالية في معالجة الفيديو وأشار إلى أن الذكاء الاصطناعي المستقبلي يحتاج إلى إجراء تنبؤات في الفضاء المجرد بدلاً من مساحة البكسل. وقد أدى ذلك إلى تفكير متعمق حول البنية واتجاه التطوير لنماذج الذكاء الاصطناعي، ويشير أيضًا إلى أن أبحاث الذكاء الاصطناعي ستواجه تحديات وفرصًا جديدة. تركز المقالة على المشكلات الصعبة التي تواجه معالجة الفيديو والأساليب والتقنيات الجديدة المطلوبة لحل هذه المشكلات.
وأشار يان ليكون، الحائز على جائزة تورينج وكبير علماء الذكاء الاصطناعي في ميتا، في المنتدى الاقتصادي العالمي إلى أن النماذج التوليدية ليست مناسبة لمعالجة مقاطع الفيديو، وأن الذكاء الاصطناعي يحتاج إلى تقديم تنبؤات في مساحة مجردة. مع استنفاد البيانات النصية على الإنترنت، يحول باحثو الذكاء الاصطناعي اهتمامهم إلى مقاطع الفيديو ويدركون أن فهم العلاقات السببية أمر بالغ الأهمية لأنظمة الذكاء الاصطناعي المستقبلية. لذلك، يجب أن تتعلم النماذج الجديدة كيفية التنبؤ في مساحة التمثيل المجرد وليس في مساحة البكسل. تكمن صعوبة معالجة الفيديو في تعقيد مساحة البكسل، لذلك هناك حاجة إلى بنيات جديدة لمعالجة مدخلات الفيديو وإجراء التنبؤات في مساحات التمثيل المجردة. ومن أجل حل المشاكل الصعبة في معالجة الفيديو، يجب إنشاء أساليب وتقنيات علمية جديدة لتمكين أنظمة الذكاء الاصطناعي من الاستفادة من المعلومات مثل البشر.تشير وجهة نظر LeCun إلى مسار البحث المستقبلي في مجال الذكاء الاصطناعي، مما يطرح تحديات جديدة من حيث ندرة البيانات وفهم السببية، ويشير أيضًا إلى أن تكنولوجيا الذكاء الاصطناعي سوف تتطور في اتجاه أكثر ذكاءً وفهمًا. في المستقبل، سيصبح اختراق قيود مساحة البكسل والتنبؤ في الفضاء المجرد نقطة انطلاق رئيسية في أبحاث الذكاء الاصطناعي.