Setelah acara siaran langsung berbagi teknologi selama 12 hari, OpenAI merilis model inferensi generasi berikutnya o3, serta versi o3-mini yang dioptimalkan untuk tugas-tugas tertentu. o3 telah membuat kemajuan terobosan dalam berbagai pengujian benchmark, kinerjanya secara signifikan melampaui model o1 generasi sebelumnya, dan bahkan mendekati tingkat kecerdasan umum buatan (AGI) dalam beberapa aspek. Rilis ini telah menarik perhatian luas di industri dan diyakini memiliki dampak besar pada metode pemrograman dan model kerja pemrogram di masa depan.
Setelah 12 hari siaran langsung berbagi teknologi, OpenAI merilis model inferensi generasi berikutnya o3 pada hari terakhir, yang merupakan versi peningkatan dari model inferensi o1 yang dirilis sebelumnya. Seri model o3 mencakup dua versi: o3 dan o3-mini, dimana o3-mini merupakan model yang lebih kecil dan ramping yang disesuaikan untuk tugas tertentu. OpenAI menyatakan bahwa model o3 dapat mendekati pencapaian kecerdasan buatan umum (AGI) dalam kondisi tertentu, yaitu kecerdasan buatan yang dapat menyelesaikan tugas apa pun yang dapat diselesaikan manusia.
Dalam tolok ukur inferensi logis grafis ARC-AGI, model o3 mencapai skor yang memecahkan rekor, dengan skor sebesar 75,7% pada skenario komputasi rendah, sedangkan pada uji komputasi tinggi mencapai 87,5%, melampaui tolok ukur yang menandai pencapaian tingkat manusia. Ambang batas 85%. Sebagai perbandingan, model o1 hanya mendapat skor antara 25% dan 32%, dan kinerja o3 hampir tiga kali lebih baik daripada o1. Pada platform kompetisi coding terkenal di dunia Codeforces, o3 memperoleh skor 2727, sedangkan o1 hanya memperoleh skor 1891.
Fu Sheng, ketua Cheetah Mobile atau Orion Star, mengatakan bahwa peluncuran OpenAI o3 menandai datangnya era di mana semua orang adalah seorang programmer. Pengguna tidak perlu mahir dalam bahasa Python atau C untuk menulis program persyaratan yang diajukan dan model prediksi besar dapat membantu. Fu Sheng percaya bahwa peluncuran o3 menandai bahwa kemampuan pemrograman model bahasa besar melampaui 99,9% pemrogram. Dalam kompetisi pemrograman kelas dunia Codeforces, o3 meraih hasil teratas di peringkat 175, sementara o1 hanya mengalahkan lebih dari 90% pemrogram. programmer. Pemrogram, GPT-4o hanya mengalahkan 11% programmer sebelumnya.
OpenAI berencana merilis model o3 secara resmi pada akhir Januari tahun depan. Fu Sheng menunjukkan bahwa meskipun pemrogram tidak akan hilang sepenuhnya, pekerjaan mereka akan lebih beralih ke pemahaman kebutuhan pengguna dan membangun logika yang besar, dan pekerjaan mengubah kebutuhan menjadi kode sebagian besar akan diselesaikan oleh AI. Rilis ini menandai penerapan AI yang lebih luas di bidang pemrograman dan mungkin juga mengubah cara kerja programmer.
Peluncuran model o3 menandai kemajuan signifikan dalam teknologi kecerdasan buatan, dan kemampuan penalaran serta pemrogramannya yang kuat akan berdampak besar pada berbagai bidang. Di masa depan, dengan perkembangan dan peningkatan teknologi yang berkelanjutan, kita dapat mengharapkan kecerdasan buatan memainkan peran yang lebih besar di lebih banyak bidang dan memberikan kenyamanan yang lebih besar bagi masyarakat manusia.