Yann LeCun baru-baru ini mengungkapkan wawasannya tentang arah pengembangan AI di Forum Ekonomi Dunia. Dia menekankan keterbatasan model generatif saat ini dalam pemrosesan video dan menunjukkan bahwa AI di masa depan perlu membuat prediksi dalam ruang abstrak, bukan dalam ruang piksel. Hal ini telah memicu pemikiran mendalam mengenai arsitektur dan arah pengembangan model AI, dan juga menunjukkan bahwa penelitian AI akan menghadapi tantangan dan peluang baru. Artikel ini berfokus pada masalah sulit yang dihadapi dalam pemrosesan video dan metode serta teknologi baru yang diperlukan untuk memecahkan masalah ini.
Yann LeCun, pemenang Turing Award dan kepala ilmuwan AI Meta, menyatakan di Forum Ekonomi Dunia bahwa model generatif tidak cocok untuk memproses video, dan AI perlu membuat prediksi dalam ruang abstrak. Ketika data teks di Internet semakin menipis, para peneliti AI mengalihkan perhatian mereka ke video dan menyadari bahwa memahami hubungan sebab akibat sangat penting untuk sistem AI di masa depan. Oleh karena itu, model baru harus belajar memprediksi dalam ruang representasi abstrak, bukan dalam ruang piksel. Kesulitan dalam pemrosesan video terletak pada kompleksitas ruang piksel, sehingga diperlukan arsitektur baru untuk memproses input video dan melakukan prediksi dalam ruang representasi abstrak. Untuk memecahkan masalah sulit dalam pemrosesan video, metode dan teknologi ilmiah baru perlu diciptakan agar sistem AI dapat memanfaatkan informasi seperti manusia.Sudut pandang LeCun menunjukkan jalan bagi penelitian masa depan di bidang AI, yang menghadirkan tantangan baru dalam hal kelangkaan data dan pemahaman kausalitas, dan juga menunjukkan bahwa teknologi AI akan berkembang ke arah yang lebih cerdas dan penuh pemahaman. Di masa depan, mendobrak keterbatasan ruang piksel dan membuat prediksi dalam ruang abstrak akan menjadi titik terobosan penting dalam penelitian AI.