Baru-baru ini, Google, raksasa di bidang kecerdasan buatan, merilis model bahasa skala besar terbarunya Gemini 1.5, yang memiliki jendela konteks 1 juta token yang mengesankan dan dapat menangani konten yang setara dengan panjang seluruh buku atau bahkan film. Perkembangan terobosan ini tidak diragukan lagi telah menarik perhatian luas di industri, yang menunjukkan bahwa kemampuan model bahasa berskala besar untuk memproses informasi telah mencapai tingkat yang baru. Namun, kapasitas tinggi tidak berarti akurasi tinggi, dan kinerja Gemini 1.5 dalam pengujian sebenarnya telah memicu diskusi.
Google baru-baru ini merilis Gemini 1.5, model dengan jendela konteks 1 juta token yang dapat menangani buku lengkap dan bahkan film. Namun dalam pengujian, akurasi Gemini 1.5 tidak terlalu tinggi, terutama pada pengujian “jarum di tumpukan jerami” yang rata-rata akurasinya hanya 60% hingga 70%. Selain itu, Google juga mempertanyakan keaslian video yang dihasilkan OpenAI Sora dan menyebutnya palsu.
Peluncuran Gemini 1.5 dan keraguan Google terhadap keaslian video Sora menyoroti tantangan yang dihadapi dalam pengembangan model bahasa skala besar, yaitu bagaimana meningkatkan akurasi dan keandalan sekaligus memastikan kapasitas model. Ini bukan hanya masalah yang dihadapi Google, tetapi juga merupakan arah yang perlu dilakukan oleh seluruh industri AI untuk bekerja sama. Dalam perkembangan di masa depan, perlu lebih banyak perhatian diberikan pada keandalan dan keamanan model untuk memastikan bahwa teknologi kecerdasan buatan benar-benar dapat bermanfaat bagi umat manusia.