Model besar StableCode adalah alat yang khusus digunakan untuk mengembangkan dan mengimplementasikan algoritme dan aplikasi kecerdasan buatan. Model ini dapat berjalan pada berbagai kerangka pembelajaran mendalam dan cocok untuk tugas-tugas seperti klasifikasi gambar, deteksi target, dan segmentasi semantik.
Stability AI terkenal karena model gambar yang dihasilkan teks Difusi Stabil, tetapi itu bukan satu-satunya bidang minatnya, karena perusahaan sekarang juga merambah ke pembuatan kode. Hari ini, Stability AI merilis StableCode model bahasa besar terbuka (LLM) baru, yang dirancang untuk membantu pengguna menghasilkan kode bahasa pemrograman dan didasarkan pada jaringan saraf transformator.
StableCode akan menawarkan tiga level berbeda: model dasar untuk penggunaan umum, model instruksi, dan model jendela konteks panjang yang mampu mendukung hingga 16,000 token.
Model StableCode mendapat manfaat dari kumpulan data bahasa pemrograman awal dari proyek BigCode open source, dan juga menjalani pemfilteran tambahan dan penyesuaian oleh Stability AI. StableCode pada awalnya akan mendukung pengembangan dalam bahasa pemrograman seperti Python, Go, Java , JavaScript, C, penurunan harga dan C++.
Pelatihan LLM apa pun bergantung pada data, dan data untuk StableCode berasal dari proyek BigCode. HuggingFace dan ServiceNow juga meluncurkan StarCoder LLM terbuka berdasarkan BigCode pada bulan Mei. Nathan Cooper, kepala ilmuwan riset di Stability AI, mengatakan pelatihan StableCode melibatkan pemfilteran dan pembersihan data BigCode secara ekstensif.
Jendela konteks panjang StableCode memiliki jendela konteks 16.000 token, yang menurut Stability AI lebih besar daripada model lainnya. Jendela konteks yang lebih panjang memungkinkan penggunaan perintah pembuatan kode yang lebih profesional dan kompleks. Ini juga berarti bahwa pengguna dapat membiarkan StableCode melihat media Basis kode berukuran berisi banyak file untuk membantu memahami dan menghasilkan kode baru.
StableCode masih dalam tahap awal, dan tujuan resminya saat ini adalah melihat bagaimana pengembang akan menerima dan menggunakan model tersebut.