Dalam beberapa tahun terakhir, teknologi model bahasa besar (LLM) telah berkembang pesat, dan AI generatif telah menunjukkan kemampuan kreatif yang mengesankan. Namun mekanisme intrinsik dan kemampuan kognitifnya masih perlu dieksplorasi lebih lanjut. Artikel ini akan membahas studi tentang kemampuan memahami model AI generatif. Melalui analisis komparatif eksperimental, penelitian ini mengungkap perbedaan performa model tersebut dalam situasi berbeda, sehingga memberikan referensi berharga bagi kita untuk memahami keterbatasan AI.
Model AI generatif seperti GPT-4 dan Midjourney telah menunjukkan kemampuan generatif yang meyakinkan. Namun, penelitian menemukan bahwa model-model ini memiliki tantangan dalam memahami konten yang dihasilkannya, yang berbeda dengan kecerdasan manusia. Secara khusus, para peneliti menemukan melalui eksperimen bahwa model ini bekerja dengan baik dalam eksperimen selektif, namun sering membuat kesalahan dalam eksperimen interogatif. Penelitian ini memerlukan kehati-hatian saat mempelajari lebih dalam kecerdasan buatan dan kognisi, karena model dapat membuat konten tetapi tidak dapat sepenuhnya memahaminya.Secara keseluruhan, penelitian ini mengingatkan kita bahwa meskipun AI generatif telah mengalami kemajuan signifikan dalam pembuatan konten, kemampuannya untuk memahami konten yang dihasilkannya masih terbatas. Penelitian di masa depan perlu mengeksplorasi lebih jauh mekanisme kognitif AI untuk mendorong perkembangan teknologi AI yang sehat dan menghindari potensi risiko. Kita perlu melihat kemampuan AI dengan lebih hati-hati dan terus berupaya menjembatani kesenjangan antara AI dan kecerdasan manusia.