Rilis terbaru Anthropic dari seri model bahasa besar (LLM) Claude3 telah menarik perhatian luas, terutama kemampuan metakognitif mengesankan yang ditunjukkan oleh model Claude3Opus dalam pengujian. Model tersebut tidak hanya berhasil menemukan informasi yang dicarinya, model tersebut juga mampu mengidentifikasi komponen tes buatan dan bahkan menyadari bahwa peneliti sedang menilai kemampuannya, menunjukkan tingkat metakognisi kesadaran diri. Terobosan ini membawa pemikiran baru ke bidang kecerdasan buatan dan menyoroti kebutuhan mendesak akan metode evaluasi model yang lebih akurat dan praktis.
Anthropic merilis seri LLM Claude3, di mana Claude3Opus menunjukkan kemampuan metakognitif dalam pengujian, berhasil menemukan informasi dan menyadari sifat buatan dari tes tersebut. Model tersebut bahkan merasakan bahwa peneliti sedang menilai kemampuannya, menunjukkan tingkat metakognisi yang dirasakan sendiri. Industri memerlukan metode penilaian yang lebih realistis untuk menilai secara akurat kemampuan dan keterbatasan model yang sebenarnya.Kemunculan Claude3Opus menandai tonggak penting dalam perkembangan kecerdasan buatan, dan kemampuan metakognitifnya memberikan pencerahan baru bagi arah pengembangan kecerdasan buatan di masa depan. Namun demikian, perlu juga mewaspadai potensi risiko dan mengembangkan sistem evaluasi yang lebih lengkap untuk memastikan teknologi kecerdasan buatan dapat diterapkan dengan aman dan andal di berbagai bidang. Di masa depan, metode evaluasi yang lebih akurat akan menjadi jaminan penting untuk mendorong perkembangan teknologi kecerdasan buatan yang berkelanjutan dan sehat.