OpenAI telah merilis model AI baru yang ekonomis, GPT-4o mini. Biayanya telah berkurang secara signifikan namun kinerjanya tidak kalah. Ini menandai langkah penting menuju penerapan teknologi AI yang lebih luas. Artikel ini akan mempelajari keunggulan performa, keamanan, dan harga GPT-4o mini, serta dampaknya terhadap pengembangan AI di masa depan.
OpenAI telah membuat langkah besar lainnya! GPT-4o mini terbaru mereka diklaim sebagai model kecil "paling terjangkau". Ini bukan sekadar peningkatan model, namun awal dari revolusi cerdas. Hari ini, mari kita mengungkap misteri GPT-4o mini dan melihat bagaimana hal itu dapat membuat kecerdasan menjadi lebih "membumi".
Menjadi lebih pintar dan menghemat uang
Visi OpenAI adalah mewujudkan kecerdasan di mana pun, dan GPT-4o mini adalah implementasi terbaru dari visi ini. Model ini tidak hanya jauh lebih rendah dalam hal biaya, tetapi juga dalam hal kinerja. Dengan hanya 15 sen per juta token masukan dan 60 sen per juta token keluaran, ini jauh lebih murah dibandingkan model mutakhir sebelumnya dan lebih dari 60% lebih murah dibandingkan GPT-3.5 Turbo.
Perawakan kecil, kebijaksanaan besar
GPT-4o mini melampaui GPT-3.5 Turbo dan model kecil lainnya dalam tolok ukur akademis, baik dalam kecerdasan teks maupun penalaran multimodal. Ini juga mendukung rentang bahasa yang sama dengan GPT-4o dan unggul dalam pemanggilan fungsi, yang memungkinkan pengembang membangun aplikasi yang dapat memperoleh data atau melakukan operasi dengan sistem eksternal dan meningkatkan kinerja konteks panjang dibandingkan dengan GPT-3.5 Turbo.
Pada tolok ukur utama, kinerja GPT-4o mini sebagai berikut:
Tugas penalaran: Dalam tugas penalaran yang melibatkan teks dan penglihatan, GPT-4o mini memperoleh skor 82,0%, dibandingkan dengan 77,9% untuk Gemini Flash dan 73,8% untuk Claude Haiku.
Kemampuan Matematika dan Pengodean: GPT-4o mini juga berkinerja baik dalam penalaran matematika dan tugas pengkodean. Pada tes MGSM (penalaran matematis), skornya 87,0%, dibandingkan dengan 75,5% untuk Gemini Flash dan 71,7% untuk Claude Haiku. Dalam tes HumanEval (kinerja pengkodean), skornya 87,2%, dibandingkan dengan 71,5% untuk Gemini Flash dan 75,9% untuk Claude Haiku.
Penalaran Multimodal: Dalam MMMU (Evaluasi Penalaran Multimodal), GPT-4o mini mendapat skor 59,4%, Gemini Flash mendapat skor 56,1%, dan Claude Haiku mendapat skor 50,2%.
Langkah-langkah keamanan bawaan
Keamanan selalu menjadi inti pengembangan model openAI. Selama fase pra-pelatihan, openAI menyaring informasi yang tidak ingin dipelajari atau dihasilkan oleh model, seperti perkataan yang mendorong kebencian, konten dewasa, situs web yang terutama mengumpulkan informasi pribadi, dan spam. Setelah pelatihan, openAI menggunakan teknik seperti pembelajaran penguatan dan umpan balik manusia (RLHF) untuk menyelaraskan perilaku model dengan kebijakan openAI serta meningkatkan akurasi dan keandalan respons model.
GPT-4o mini memiliki mitigasi keamanan yang sama dengan yang ada di GPT-4o, yang dievaluasi secara cermat oleh openAI melalui evaluasi otomatis dan manusia berdasarkan kerangka kesiapan awal dan komitmen sukarela. Lebih dari 70 pakar eksternal di berbagai bidang seperti psikologi sosial dan misinformasi menguji GPT-4o untuk mengidentifikasi potensi risiko, yang kini telah diatasi oleh openAI dan rencananya akan disertakan dalam Kartu Sistem GPT-4o dan Kartu Skor Kesiapan yang akan datang. Wawasan dari penilaian para ahli ini telah membantu meningkatkan keamanan GPT-4o dan GPT-4o mini.
Ketersediaan dan harga
GPT-4o mini kini tersedia di Assistant API, Chat Completion API, dan Batch API sebagai model teks dan visual. Pengembang membayar 15 sen per 1 juta token masukan dan 60 sen per 1 juta token keluaran (kira-kira setara dengan 2500 halaman dalam buku standar). Kami berencana meluncurkan kemampuan penyesuaian untuk GPT-4o mini dalam beberapa hari mendatang.
Di ChatGPT, pengguna Gratis, Plus, dan Tim akan dapat mengakses GPT-4o mini mulai hari ini, menggantikan GPT-3.5. Pengguna perusahaan juga akan memiliki akses mulai minggu depan, sejalan dengan misi openAI untuk menjadikan manfaat AI tersedia bagi semua orang.
pandangan masa depan
Tim OpenAI mengatakan: “Selama beberapa tahun terakhir, kami telah menyaksikan kemajuan signifikan dalam kecerdasan AI sekaligus mengurangi biaya secara signifikan, misalnya, sejak peluncuran model text-davinci-003 yang kurang bertenaga pada tahun 2022, Biaya per GPT-4o mini. token telah turun sebesar 99%. Kami berkomitmen untuk terus mengurangi biaya sambil meningkatkan kemampuan model."
“Kami membayangkan masa depan di mana model dapat diintegrasikan secara mulus ke dalam setiap aplikasi dan situs web. GPT-4o mini membuka jalan bagi pengembang untuk membangun dan menskalakan aplikasi AI yang kuat dengan lebih efisien dan terjangkau tertanam dalam pengalaman digital kami sehari-hari, dan kami bersemangat untuk terus memimpin upaya ini.”
Secara keseluruhan, GPT-4o mini memberikan landasan yang kuat untuk mempopulerkan aplikasi AI dengan kinerjanya yang luar biasa, harga yang ekonomis, dan langkah-langkah keamanan yang kuat, yang menunjukkan bahwa teknologi AI akan lebih terintegrasi ke dalam kehidupan kita.