Model AI terbaru OpenAI “o1-preview” (sebelumnya diberi nama kode “Strawberry”) telah memicu diskusi hangat. OpenAI mengklaim bahwa kemampuannya sama bagusnya dengan mahasiswa PhD, namun dalam pengujian sebenarnya menunjukkan kesalahan yang mengecewakan. Editor Downcodes akan membawa Anda untuk memiliki pemahaman mendalam tentang model AI yang sangat dinanti namun bermasalah ini untuk melihat level apa yang telah dicapai dan masukan nyata dari pengguna.
Baru-baru ini, OpenAI meluncurkan model AI yang sangat dinanti, yang sebelumnya diberi nama kode "Strawberry" dan secara resmi diberi nama "o1-preview".
OpenAI menjanjikan model baru ini akan bekerja sebaik mahasiswa PhD dalam tugas-tugas benchmark yang sulit dalam fisika, kimia, dan biologi. Namun hasil uji awal menunjukkan bahwa AI ini masih jauh dari tujuannya untuk menggantikan ilmuwan atau pemrogram manusia.
Di media sosial, banyak pengguna berbagi pengalaman mereka berinteraksi dengan AI “OpenAI o1”, dan hasilnya menunjukkan bahwa model tersebut masih berkinerja buruk pada tugas-tugas dasar.
Misalnya, Mathieu Acher, peneliti di INSA Rennes, menemukan bahwa OpenAI o1 sering kali mengusulkan gerakan ilegal saat memecahkan teka-teki catur tertentu.
Ilmuwan Meta AI Colin Fraser menunjukkan bahwa dalam teka-teki sederhana tentang petani yang mengangkut domba melintasi sungai, AI sebenarnya memberikan jawaban yang benar dan malah memberikan omong kosong yang tidak masuk akal.
Bahkan dalam teka-teki logika yang digunakan OpenAI sebagai demonstrasi, pertanyaan yang melibatkan stroberi menyebabkan pengguna mendapatkan jawaban berbeda, dengan satu pengguna menemukan bahwa model tersebut memiliki tingkat kesalahan hingga 75%.
Tidak hanya itu, beberapa pengguna melaporkan bahwa model baru ini bahkan membuat kesalahan saat menghitung berapa kali huruf "R" muncul di kata "strawberry".
Meskipun OpenAI menyatakan pada saat peluncurannya bahwa ini adalah model awal dan belum memiliki fitur seperti penjelajahan web dan pengunggahan file, kesalahan mendasar seperti itu masih mengejutkan.
Untuk meningkatkannya, OpenAI memperkenalkan proses "rantai berpikir" pada model baru, menjadikan OpenAI o1 berbeda secara signifikan dari model GPT-4o sebelumnya. Pendekatan ini memungkinkan AI untuk berpikir berulang kali sebelum sampai pada suatu jawaban, meskipun hal ini juga menghasilkan waktu respons yang lebih lama.
Beberapa pengguna menemukan bahwa model tersebut sebenarnya membutuhkan waktu 92 detik untuk memberikan jawaban atas teka-teki kata, namun hasilnya tetap salah.
Noam Brown, seorang ilmuwan peneliti di OpenAI, mengatakan bahwa meskipun kecepatan respons saat ini lambat, mereka memperkirakan versi mendatang akan berpikir lebih lama dan bahkan memberikan wawasan baru tentang terobosan masalah.
Namun, kritikus AI terkenal Gary Marcus skeptis tentang hal ini dan percaya bahwa pemrosesan jangka panjang tidak selalu menghasilkan kemampuan penalaran yang transenden. Dia menekankan bahwa meskipun teknologi AI terus berkembang, penelitian dan eksperimen di kehidupan nyata masih sangat diperlukan.
Terlihat bahwa dalam penggunaan sebenarnya, performa model AI baru OpenAI masih mengecewakan di segala aspek, dan hal ini juga memicu diskusi tentang perkembangan teknologi AI di masa depan.
Menyorot:
Baru-baru ini, OpenAI meluncurkan model AI baru "Strawberry", yang diklaim dapat dibandingkan dengan mahasiswa PhD dalam tugas-tugas kompleks.
Banyak pengguna menemukan bahwa AI sering melakukan kesalahan pada tugas-tugas dasar, seperti melakukan gerakan ilegal dan salah menjawab teka-teki sederhana.
? OpenAI mengakui bahwa model ini masih dalam pengembangan, namun pemikiran jangka panjang mungkin tidak meningkatkan kemampuan penalaran, dan banyak masalah mendasar yang masih belum terselesaikan.
Secara keseluruhan, meskipun model "o1-preview" OpenAI menunjukkan potensi pengembangan teknologi AI, model ini juga memperlihatkan banyak kekurangan dalam penerapan praktisnya. Di masa depan, pengembangan model AI masih perlu mencapai keseimbangan antara peningkatan teknis dan penerapan praktis agar benar-benar mencapai tujuan yang diharapkan. Editor Downcodes akan terus memperhatikan tren di bidang AI dan memberikan Anda laporan yang lebih menarik.