Versi uji coba Gemini baru Google mendapatkan kembali posisi teratas dalam kompetisi AI, GPT-4o hanya berkuasa selama satu hari

Penulis：Eve Cole Waktu Pembaruan：2025-01-24 15:24:01

Baru-baru ini, persaingan antara raksasa AI Google dan OpenAI semakin ketat. Kedua pihak bersaing ketat dalam pengembangan dan kecepatan iterasi model bahasa berskala besar. Model Gemini-Exp-1121 yang baru dirilis Google telah melampaui GPT-4o OpenAI dalam banyak indikator utama, sekali lagi menempati posisi teratas dalam kompetisi AI. Editor Downcodes akan memberi Anda pemahaman mendalam tentang "blitz" di bidang AI, serta kemajuan terkini dalam teknologi dan fungsionalitas antara kedua belah pihak.

Belakangan ini persaingan antara Google dan OpenAI kembali memanas. Hanya satu hari setelah versi baru GPT-4o menduduki puncak daftar kompetisi AI, Google meluncurkan model eksperimental terbaru Gemini-Exp-1121, dengan cepat merebut kembali kejuaraan tersebut. Seminggu yang lalu, Google merilis Gemini-Exp-1114, yang sepertinya menunjukkan bahwa Google merespons dinamika OpenAI dengan sangat cepat.

Jack Rae, kepala ilmuwan Google DeepMind, mengatakan bahwa ini adalah "blitz", yang menyiratkan bahwa kecepatan iterasi pasca-pelatihan lebih cepat daripada pra-pelatihan.

Menurut informasi resmi, Gemini-Exp-1121 telah ditingkatkan secara signifikan dalam banyak aspek, terutama tercermin dalam peningkatan kemampuan pengkodean, kemampuan penalaran, dan kemampuan pemahaman visual. Selain itu, model ini telah mencapai tingkat yang sebanding dengan pratinjau o1 teratas saat ini dan Sonnet3.5 Baru dalam kontrol gaya kata-kata cepat yang kompleks.

Dalam pengujian sebenarnya, Gemini-Exp-1121 juga berkinerja lebih baik daripada versi baru GPT-4o dalam menangani pemahaman komik. Jawabannya lebih komprehensif dan dapat menggunakan subtitle dengan jelas serta penekanan yang berani untuk menyajikan informasi. Pada pertanyaan penalaran logis klasik Animal Crossing River, jawaban Gemini-Exp-1121 sepenuhnya benar, menunjukkan kemampuan penalaran logis yang lebih kuat. Di sisi lain, versi baru GPT-4o melakukan beberapa kesalahan.

Pada saat yang sama, OpenAI juga secara aktif mengembangkan fitur-fitur baru. Baru-baru ini, kode untuk fungsi video "Kamera Langsung" ditemukan di versi terbaru ChatGPT, yang menandai kemajuannya dalam pengenalan suara dan visual. Pengguna OpenAI juga akan merasakan kemampuan ini untuk pertama kalinya saat menggunakan Advanced Speech Mode, yang menunjukkan niatnya untuk memperluas penggunaan fitur ini di masa mendatang.

Diperkirakan tahun depan metode utama komunikasi dengan Chatbot akan secara bertahap beralih dari dialog teks tradisional ke layanan suara dan agen yang lebih cerdas. Perubahan ini mungkin disebabkan oleh peluncuran fungsi "kamera langsung".

Persaingan AI ini masih terus berlangsung, dengan Google dan OpenAI yang saling berkejaran, menandakan bahwa teknologi AI akan terus melakukan terobosan dan inovasi di masa depan, menghadirkan layanan yang lebih nyaman dan cerdas bagi pengguna. Mari kita tunggu dan lihat siapa yang akan menang pada akhirnya!