Model o3AI OpenAI yang baru dirilis telah menarik perhatian industri karena kinerjanya yang kuat dan biaya pengoperasian yang tinggi. Model ini mencapai hasil yang mengesankan pada benchmark ARC-AGI, tetapi menghabiskan biaya lebih dari $1.000 per misi, jauh lebih mahal dibandingkan pendahulunya. Hal ini menyoroti kontradiksi antara peningkatan kinerja dan pengendalian biaya model kecerdasan buatan, dan juga memicu diskusi tentang semakin berkurangnya keuntungan dalam pendekatan "penskalaan". Artikel ini akan memberikan analisis mendalam tentang kinerja, biaya, dan pengembangan model o3AI di masa depan.
Model o3AI OpenAI yang baru-baru ini diluncurkan dianggap sebagai produk kecerdasan buatan yang paling kuat, namun biaya operasionalnya sangat besar, dengan satu tugas memerlukan biaya lebih dari $1.000.
Menurut TechCrunch, model baru ini menggunakan teknik yang disebut "penghitungan waktu pengujian" ketika menangani masalah yang kompleks, yang berarti model ini menghabiskan lebih banyak waktu untuk berpikir dan mengeksplorasi berbagai kemungkinan sebelum sampai pada sebuah jawaban. Oleh karena itu, para insinyur OpenAI berharap o3 dapat menghasilkan respons yang lebih baik dalam perintah yang kompleks.
Menurut François Chollet, pendiri benchmark ARC-AGI, o3 mencapai skor 87,5% dalam "mode komputasi tinggi" yang kuat, yang hampir tiga kali lipat skor model o1 generasi sebelumnya sebesar 32%. Hal ini menunjukkan bahwa peningkatan kinerja o3 cukup signifikan. Namun, proses penghitungan yang rumit ini memerlukan biaya tambahan yang besar. Untuk mencapai skor tinggi ini, biaya komputasi O3 melebihi $1.000 per tugas, menggunakan daya komputasi 170 kali lebih banyak dibandingkan versi O3 yang berdaya rendah, dan jauh lebih tinggi dibandingkan pendahulunya, yang berbiaya kurang dari $4 per tugas.
Situasi ini menyebabkan industri memperhatikan kontradiksi antara kinerja model o3 dan biaya operasionalnya. Di satu sisi, peningkatan signifikan pada skor o3 tampaknya membuktikan bahwa model kecerdasan buatan masih dapat mencapai kemajuan melalui "penskalaan", yakni menambah kekuatan pemrosesan dan data pelatihan. Namun di sisi lain, kritik semakin meningkat mengenai semakin berkurangnya hasil ekspansi. Meskipun peningkatan o3 terutama disebabkan oleh perbaikan metode "penalaran" daripada ekspansi sederhana, biaya operasionalnya yang tinggi tidak diragukan lagi membuat masyarakat khawatir.
Bahkan versi komputasi rendah dari o3, yang mendapat skor 76% pada benchmark, berharga sekitar $20 per tugas, menjadikannya pilihan yang relatif murah dibandingkan pendahulunya. Selain itu, mengingat ChatGPT Plus hanya mengenakan biaya US$25 per bulan, OpenAI menghadapi tekanan biaya yang sangat besar ketika meningkatkan tingkat kecerdasan yang digunakan oleh pengguna.
Dalam postingan blognya tentang hasil benchmark, Chollet mencatat bahwa meskipun o3 mendekati tingkat kinerja manusia, "biayanya masih tinggi dan belum ekonomis." Dia mengatakan biaya tenaga kerja untuk menyelesaikan tugas ARC-AGI adalah sekitar $5 per tugas, sedangkan konsumsi energi hanya beberapa sen. Namun, ia optimis bahwa "efektivitas biaya kemungkinan akan meningkat secara signifikan dalam beberapa bulan dan tahun mendatang." Saat ini, o3 belum dirilis ke publik, dan "versi mini"-nya diperkirakan akan diluncurkan pada bulan Januari tahun depan.
Highlight:
Satu kueri model o3AI berharga lebih dari $1.000, yang menunjukkan tingginya biaya pengoperasiannya.
Pada benchmark ARC-AGI, o3 memperoleh skor 87,5%, hampir tiga kali lebih tinggi dibandingkan model o1 generasi sebelumnya.
Saat ini, o3 belum dirilis ke publik, dan "versi mini" diperkirakan akan diluncurkan pada Januari tahun depan.
Secara keseluruhan, model o3AI menunjukkan potensi pengembangan yang kuat dari teknologi kecerdasan buatan, namun juga mengungkap tantangan yang ditimbulkan oleh tingginya biaya. Di masa depan, bagaimana menyeimbangkan peningkatan kinerja dan pengendalian biaya akan menjadi isu utama di bidang kecerdasan buatan, dan "versi mini" dari model o3AI juga sangat dinantikan perhatian terus-menerus.