Cognition meluncurkan programmer AI yang luar biasa, Genie, yang mengalahkan Devin dan GPT-4 dengan skor 30,08% pada platform pengujian resmi SWE-Bench, menjadi asisten pemrograman AI terkuat di dunia. Editor Downcodes akan memberi Anda pemahaman mendalam tentang terobosan teknologi dan prospek masa depan di balik Genie.
Startup AI, Cognition, telah meluncurkan programmer AI baru "Genie", kinerjanya luar biasa, ia langsung mengalahkan Devin dan GPT-4 dan menjadi asisten pemrograman AI paling kuat di dunia.
Pemrogram AI ini mendapat skor setinggi 30,08% pada platform pengujian resmi SWE-Bench, jauh melebihi Devin yang 13,8% dan Swe-agent+GPT-4 yang 12,47%.
Anda mungkin bertanya-tanya, bagaimana Genie melakukannya? Pada awal Desember 2022, salah satu pendiri Genie, Alistair Pullen, mendemonstrasikan proyek ini di Universitas London. Ia berharap dapat menciptakan program AI yang dapat secara otomatis mengkode, men-debug, dan mengoptimalkan seperti manusia. Setelah lebih dari satu tahun pengembangan, Genie akhirnya memasuki tahap pengujian dan menerima pembiayaan putaran awal sebesar US$2,5 juta.
Alistair menyebutkan kesuksesan Genie erat kaitannya dengan data dan metode pelatihannya. Tidak seperti penyesuaian tradisional pada model besar, Genie menggunakan kumpulan data khusus yang menggabungkan proses penalaran pemrogram manusia. Data tersebut mencakup penemuan pengetahuan langkah demi langkah dan proses pengambilan keputusan berdasarkan kasus, memungkinkan Genie untuk menunjukkan penilaian yang serupa dengan yang dilakukan seorang insinyur manusia ketika menghadapi masalah yang kompleks.
Selain itu, Genie juga menggunakan “mekanisme pengembangan diri” yang unik. Awalnya, Genie berlatih dengan data berkualitas tinggi dan mencapai kondisi "sempurna", namun dalam prosesnya, Genie gagal menilai kesalahannya sendiri dan gagal melakukan perbaikan. Untuk mengatasi masalah ini, pengembang menggunakan Genie untuk menghasilkan beberapa data sintetis guna lebih memperkaya konten pelatihan. Ibarat seorang ibu yang mengajari anaknya berjalan dan memberikan bimbingan yang benar setiap kali terjatuh.
Setelah berulang kali pelatihan, kemampuan Genie telah meningkat pesat, dan bahkan dapat menunjukkan solusi kreatif untuk masalah yang tidak terlihat. Secara fungsional, Genie mendukung berbagai tugas pengembangan, termasuk pengembangan fungsi, perbaikan BUG, pemfaktoran ulang kode, pengujian kode, dll., yang mencakup lusinan bahasa pemrograman seperti JavaScript, Python, dan Java.
Kini, Genie telah membuka aplikasi untuk penggunaan uji coba. Anda bisa mendaftar melalui situs resminya. Izin uji coba diharapkan akan dikeluarkan dalam beberapa minggu ke depan.
Blog resmi: https://cosine.sh/blog/state-of-the-art
Alamat pengalaman: https://cosine.sh/register
Menyorot:
Genie mendapat skor setinggi 30,08% dalam tes SWE-Bench, menjadi programmer AI terkuat di dunia.
Menggunakan kumpulan data khusus dan mekanisme pengembangan diri, Genie unggul dalam pengkodean yang kompleks.
? Aplikasi untuk uji coba saat ini terbuka, dan lebih banyak fitur kejutan akan diluncurkan di masa mendatang!
Kemunculan Genie menandai terobosan baru di bidang asisten pemrograman AI. Metode pelatihan unik dan mekanisme pengembangan diri patut mendapat perhatian industri. Editor Downcodes berharap Genie menghadirkan lebih banyak kejutan bagi pengembang di masa depan!