Baru -baru ini, OpenAI merilis laporan penelitian tentang model inferensi terbaru O3, menunjukkan kemajuan signifikan dari model bahasa besar (LLM) di bidang pemrograman. Model O3 mencapai skor tinggi 2724 pada platform pemrograman terkenal Codeforces, peringkat di 99,8% teratas di dunia, dan berkinerja sangat baik. Selain itu, model ini memenangkan tingkat medali emas di Olimpiade Informatika Internasional (IOI) 2024, menandai kemampuannya yang luar biasa dalam kompetisi pemrograman.
Catatan Sumber Gambar: Gambar dihasilkan oleh AI, dan Penyedia Layanan Resmi Gambar Midjourney
Penelitian menunjukkan bahwa model O3 tampil dalam kompetisi IOI di luar model O1-IOI khusus disesuaikan untuk acara tersebut. Hasil ini mengungkapkan potensi besar pembelajaran penguatan di bidang pemrograman, menunjukkan bahwa model umum yang dilatih melalui pembelajaran penguatan dapat melampaui solusi khusus domain untuk desain tangan. Dalam acara IOI 2024, O3 berhasil melewati ambang medali emas dalam kondisi standar, dan pada saat yang sama peringkat di antara 200 programmer teratas di dunia pada platform Codeforces, menunjukkan kekuatannya untuk bersaing dengan programmer manusia top.
Ethan Mollick, seorang profesor di Wharton, mengatakan: “Kemampuan penalaran universal yang dikembangkan melalui pembelajaran penguatan telah melampaui solusi khusus domain yang dirancang dengan baik. Kemampuan memungkinkan model umum yang besar untuk mencapai hasil yang lebih baik.
Studi ini adalah bagian dari evaluasi Openai tentang kinerja modelnya dalam pemrograman kompetitif dan bidang rekayasa perangkat lunak yang lebih luas. Sementara itu, perusahaan AI lain, Anthropic, juga merilis laporan tentang dampak AI di tempat kerja pada hari Senin ini. Laporan tersebut mencatat bahwa sekitar 36% pekerjaan menggunakan AI dalam setidaknya 25% dari tugas kerja, sementara 57% aplikasi AI meningkatkan kemampuan manusia dan 43% fokus pada otomatisasi. Namun demikian, hanya 4% dari pekerjaan, AI digunakan untuk setidaknya 75% tugas kerja, menunjukkan bahwa masih ada banyak ruang untuk pengembangan untuk penerapan AI di tempat kerja.
Laporan ini juga menunjukkan bahwa pengembangan perangkat lunak dan penulisan teknis adalah bidang utama aplikasi AI, dan bahwa AI memiliki peran yang relatif kecil dalam tugas yang melibatkan interaksi fisik dengan lingkungan. Penemuan ini mengungkapkan perbedaan dalam penerapan AI di bidang yang berbeda, dan juga memberikan arahan untuk pengembangan teknologi di masa depan.
Singkatnya, kinerja yang sangat baik dari model O3 di Codeforces dan IOI menunjukkan potensi kuat pembelajaran penguatan di bidang pemrograman. Pada saat yang sama, penggunaan AI yang meluas di tempat kerja, terutama kinerjanya yang luar biasa di bidang pengembangan perangkat lunak dan penulisan teknis, menunjukkan bahwa teknologi AI akan terus mempromosikan perubahan di semua lapisan masyarakat di masa depan.