Yann LeCun a récemment exprimé son point de vue sur l'orientation du développement de l'IA lors du Forum économique mondial. Il a souligné les limites des modèles génératifs actuels dans le traitement vidéo et a souligné que l'IA future devra faire des prédictions dans l'espace abstrait plutôt que dans l'espace des pixels. Cela a déclenché une réflexion approfondie sur l’architecture et l’orientation du développement des modèles d’IA, et indique également que la recherche sur l’IA sera confrontée à de nouveaux défis et opportunités. L'article se concentre sur les problèmes difficiles rencontrés dans le traitement vidéo et sur les nouvelles méthodes et technologies nécessaires pour résoudre ces problèmes.
Yann LeCun, lauréat du prix Turing et scientifique en chef de l'IA chez Meta, a souligné lors du Forum économique mondial que les modèles génératifs ne sont pas adaptés au traitement des vidéos et que l'IA doit faire des prédictions dans un espace abstrait. Alors que les données textuelles sur Internet s’épuisent, les chercheurs en IA se tournent vers les vidéos et se rendent compte que la compréhension des relations causales est cruciale pour les futurs systèmes d’IA. Par conséquent, les nouveaux modèles devraient apprendre à prédire dans un espace de représentation abstrait plutôt que dans un espace de pixels. La difficulté du traitement vidéo réside dans la complexité de l’espace des pixels. De nouvelles architectures sont donc nécessaires pour traiter les entrées vidéo et faire des prédictions dans des espaces de représentation abstraits. Afin de résoudre les problèmes difficiles du traitement vidéo, de nouvelles méthodes et technologies scientifiques doivent être créées pour permettre aux systèmes d’IA d’utiliser les informations comme les humains.Le point de vue de LeCun indique la voie à suivre pour la recherche future dans le domaine de l'IA, posant de nouveaux défis en termes de rareté des données et de compréhension de la causalité, et indique également que la technologie de l'IA se développera dans une direction plus intelligente et plus compréhensive. À l’avenir, dépasser les limites de l’espace des pixels et faire des prédictions dans l’espace abstrait deviendra une avancée clé dans la recherche sur l’IA.