Янн ЛеКун недавно высказал свое мнение о направлении развития ИИ на Всемирном экономическом форуме. Он подчеркнул ограничения существующих генеративных моделей в обработке видео и отметил, что будущий ИИ должен делать прогнозы в абстрактном пространстве, а не в пространстве пикселей. Это заставило задуматься об архитектуре и направлении развития моделей ИИ, а также указывает на то, что исследования ИИ столкнутся с новыми проблемами и возможностями. Статья посвящена сложным проблемам, возникающим при обработке видео, а также новым методам и технологиям, необходимым для решения этих проблем.
Ян ЛеКун, лауреат премии Тьюринга и главный научный сотрудник компании Meta в области искусственного интеллекта, отметил на Всемирном экономическом форуме, что генеративные модели не подходят для обработки видео, а искусственному интеллекту необходимо делать прогнозы в абстрактном пространстве. Поскольку текстовые данные в Интернете исчерпаны, исследователи ИИ обращают свое внимание на видео и понимают, что понимание причинно-следственных связей имеет решающее значение для будущих систем ИИ. Следовательно, новые модели должны научиться прогнозировать в пространстве абстрактного представления, а не в пространстве пикселей. Сложность обработки видео заключается в сложности пиксельного пространства, поэтому необходимы новые архитектуры для обработки видеовходов и прогнозирования в абстрактных пространствах представления. Чтобы решить сложные проблемы обработки видео, необходимо создать новые научные методы и технологии, которые позволят системам искусственного интеллекта использовать информацию так же, как люди.Точка зрения ЛеКуна указывает путь для будущих исследований в области ИИ, ставя новые задачи с точки зрения нехватки данных и понимания причинно-следственной связи, а также указывает на то, что технология ИИ будет развиваться в более разумном и понимающем направлении. В будущем преодоление ограничений пиксельного пространства и прогнозирование в абстрактном пространстве станет ключевым моментом в исследованиях ИИ.