Yann LeCun expresó recientemente sus ideas sobre la dirección del desarrollo de la IA en el Foro Económico Mundial. Enfatizó las limitaciones de los modelos generativos actuales en el procesamiento de video y señaló que la IA futura necesita hacer predicciones en un espacio abstracto en lugar de en un espacio de píxeles. Esto ha desencadenado una reflexión profunda sobre la arquitectura y la dirección de desarrollo de los modelos de IA, y también indica que la investigación de la IA enfrentará nuevos desafíos y oportunidades. El artículo se centra en los difíciles problemas encontrados en el procesamiento de vídeo y los nuevos métodos y tecnologías necesarios para resolverlos.
Yann LeCun, ganador del Premio Turing y científico jefe de IA de Meta, señaló en el Foro Económico Mundial que los modelos generativos no son adecuados para procesar videos y que la IA necesita hacer predicciones en un espacio abstracto. A medida que se agotan los datos de texto en Internet, los investigadores de IA están centrando su atención en los videos y se dan cuenta de que comprender las relaciones causales es crucial para los futuros sistemas de IA. Por lo tanto, los nuevos modelos deberían aprender a predecir en un espacio de representación abstracta en lugar de en un espacio de píxeles. La dificultad en el procesamiento de vídeo radica en la complejidad del espacio de píxeles, por lo que se necesitan nuevas arquitecturas para procesar entradas de vídeo y hacer predicciones en espacios de representación abstractos. Para resolver los difíciles problemas del procesamiento de vídeo, es necesario crear nuevos métodos y tecnologías científicos que permitan a los sistemas de inteligencia artificial utilizar la información como los humanos.El punto de vista de LeCun señala el camino para futuras investigaciones en el campo de la IA, planteando nuevos desafíos en términos de escasez de datos y comprensión de la causalidad, y también indica que la tecnología de la IA se desarrollará en una dirección más inteligente y comprensiva. En el futuro, romper las limitaciones del espacio de píxeles y hacer predicciones en el espacio abstracto se convertirá en un punto de avance clave en la investigación de la IA.