Dalam beberapa tahun terakhir, model bahasa besar (LLM) telah mencapai kemajuan signifikan dalam kemampuan penalaran akal sehat. Artikel ini berfokus pada kinerja model Gemini Pro Google dalam tugas penalaran yang masuk akal dan membandingkannya dengan model terkemuka lainnya. Hasil penelitian menunjukkan bahwa Gemini Pro bahkan melampaui GPT-3.5 dalam beberapa tugas tertentu, dan menunjukkan mekanisme penalaran canggihnya dalam eksperimen komparatif dengan GPT-4 Turbo.
Gemini Pro menunjukkan harapan yang kuat dalam penalaran yang masuk akal, dengan penelitian baru yang menantang penilaian sebelumnya. Setara dengan GPT-3.5, Gemini Pro sedikit mengungguli pada tugas tertentu. Eksperimen inferensi menunjukkan bahwa Gemini Pro dan GPT-4Turbo menunjukkan mekanisme inferensi tingkat lanjut pada jawaban yang benar dan salah.
Secara keseluruhan, Gemini Pro menunjukkan kinerja yang mengesankan di bidang penalaran akal sehat, memberikan arah dan kemungkinan baru untuk pengembangan kecerdasan buatan di masa depan. Analisis komparatifnya dengan model lanjutan lainnya juga memberikan referensi berharga bagi kita untuk lebih memahami dan mengevaluasi kemampuan model bahasa besar. Penelitian lebih lanjut akan membantu mengungkap lebih lengkap kelebihan dan keterbatasan Gemini Pro.