Google Gemini Exp 1114 telah lahir! Menghancurkan GPT-4 dalam pertempuran pertama, mencapai puncak dalam berbagai evaluasi kemampuan dan mengejutkan industri

Penulis：Eve Cole Waktu Pembaruan：2025-01-28 08:48:02

Versi eksperimental Gemini Google DeepMind (Exp1114) berkinerja luar biasa di platform Chatbot Arena! Setelah pengujian komunitas dengan lebih dari 6.000 suara, aplikasi ini mengungguli pesaingnya di beberapa bidang utama, terutama matematika, perintah kompleks, dan penulisan kreatif, sehingga menunjukkan kemampuan keseluruhan yang kuat. Editor Downcodes akan memberi Anda pemahaman mendalam tentang kinerja luar biasa Gemini-Exp-1114 dan interpretasi industri terhadapnya.

Versi eksperimental Gemini terbaru Google DeepMind (Exp1114) telah mencapai hasil yang mengesankan di platform Chatbot Arena. Setelah lebih dari seminggu pengujian komunitas, akumulasi data lebih dari 6.000 suara menunjukkan bahwa model baru ini melampaui produk pesaing dengan keunggulan signifikan dan menunjukkan kekuatan luar biasa di banyak bidang utama.

Dalam hal skor keseluruhan, Gemini-Exp-1114 berada di posisi pertama dengan GPT-4-terbaru dengan skor luar biasa lebih dari 40 poin, melampaui versi pratinjau GPT-4 yang sebelumnya memimpin. Yang lebih menakjubkan lagi adalah model ini telah mencapai puncak dalam bidang inti seperti matematika, perintah kompleks, dan penulisan kreatif, yang menunjukkan kekuatan komprehensifnya yang kuat.

Secara khusus, kemajuan Gemini-Exp-1114 sangat mengesankan:

Melompat dari peringkat ke-3 ke peringkat pertama secara keseluruhan

Penilaian kemampuan matematika naik dari peringkat 3 menjadi peringkat 1

Pemrosesan cepat yang rumit naik dari posisi ke-4 ke posisi ke-1

Performa menulis kreatif meningkat dari peringkat 2 menjadi peringkat 1

Kemampuan pemrosesan visual juga menempati urutan teratas

Level pemrograman juga meningkat dari peringkat 5 menjadi peringkat 3

Google AI Studio telah secara resmi meluncurkan versi baru ini untuk dinikmati pengguna. Namun, komunitas juga telah menyatakan keprihatinannya mengenai beberapa masalah spesifik, seperti apakah batas 1.000 token masih ada, dan bagaimana menangani masalah penerapan praktis seperti keluaran teks yang sangat panjang.

Analis industri percaya bahwa terobosan ini menunjukkan bahwa investasi jangka panjang Google di bidang AI mulai membuahkan hasil. Menariknya, model ini mempertahankan peringkat ke-4 dalam pengendalian gaya, yang mungkin berarti bahwa tim pengembangan lebih banyak mengadopsi metode pasca-pelatihan baru daripada melakukan perubahan pada model yang telah dilatih sebelumnya.

Terobosan besar ini juga memicu diskusi mengenai struktur industri. OpenAI sudah sering meluncurkan produk baru ketika pesaing merilis pembaruan penting, namun kali ini kemajuan Google begitu besar sehingga menarik perhatian industri. Beberapa orang percaya bahwa hal ini mungkin menandai kedatangan Gemini2, dan bahwa daya saing Google di bidang model besar meningkat secara signifikan.

Kinerja luar biasa dari Gemini-Exp-1114 menandai terobosan tonggak sejarah lainnya bagi Google di bidang model AI besar, dan juga membawa lebih banyak kemungkinan untuk pengembangan AI di masa depan. Kami menantikan lebih banyak kejutan di versi Gemini berikutnya!