Penalaran Open Source Peneliti Model Kecerdasan Buatan Sky -T1 Biaya Kurang dari $ 450 - AI Artikel

Penulis：Eve Cole Waktu Pembaruan：2025-02-18 09:00:03

Baru-baru ini, tim Lab Computing Sky di University of California, Berkeley merilis Sky-T1-32B-Preview, sebuah model intelijen buatan inferensi open-open-source yang menandai pengembangan AI inferensi lebih mudah dan lebih murah. Model ini berkinerja baik dalam beberapa tolok ukur utama, bahkan sebanding dengan versi OpenAI versi O1 yang sebelumnya.

Biaya pelatihan Sky-T1 sangat mengesankan, hanya dengan $ 450, yang berarti bahwa replikasi kemampuan penalaran tingkat tinggi telah menjadi lebih terjangkau dan efisien. Sementara biaya $ 450 mungkin tidak terdengar rendah, ini adalah penurunan besar dibandingkan dengan biaya pelatihan yang harganya ratusan juta dolar beberapa tahun yang lalu. Dengan bantuan data pelatihan sintetis, yaitu data pelatihan yang dihasilkan oleh model lain, biaya berkurang secara signifikan. Penulis perusahaan AI baru -baru ini merilis Palmyra X004, yang hampir seluruhnya bergantung pada data sintetis, dan biaya pengembangan hanya $ 700.000.

大脑大模型 AI

Tidak seperti kebanyakan AIS, model inferensi mampu memeriksa sendiri secara efektif, yang membuatnya lebih dapat diandalkan ketika berhadapan dengan beberapa masalah umum. Model inferensi biasanya membutuhkan lebih banyak waktu ketika mendapatkan solusi, yang dapat memakan waktu detik hingga menit, tetapi di bidang seperti fisika, sains, dan matematika, keunggulan keandalannya signifikan.

Tim Novasky menggunakan model inferensi lain-alibaba QWQ-32B-preview untuk menghasilkan data pelatihan awal Sky-T1 dan "merencanakan" data format yang lebih operasional. Hanya perlu sekitar 19 jam untuk melatih Sky-T1 dengan 3,2 miliar parameter, menggunakan satu set 8 NVIDIA H100GPUS. Jumlah parameter secara kasar terkait dengan kemampuan pemecahan masalah model.

Menurut tim Novasky, Sky-T1 mengungguli versi pratinjau awal O1 pada koleksi tantangan matematika "tingkat kontes" Math500. Selain itu, Sky-T1 telah mengalami lebih banyak kesulitan di LiveCodebench daripada versi pratinjau O1. Namun, Sky-T1 berkinerja lebih buruk daripada pratinjau O1 dalam tes GPQA-Diamond dalam hal masalah yang melibatkan fisika, biologi dan kimia.

Perlu dicatat bahwa Openai's GA versi O1 lebih kuat daripada versi pratinjau, dan OpenAI diharapkan untuk merilis model inferensi O3 yang lebih baik dalam beberapa minggu ke depan. Namun, tim Novasky mengatakan bahwa Sky-T1 hanyalah awal dari perjalanan mereka untuk mengembangkan model open source dengan kemampuan penalaran lanjutan.

“Ke depan, kami akan fokus pada pengembangan model yang lebih efisien untuk mempertahankan kinerja inferensi yang kuat dan mengeksplorasi teknologi canggih yang semakin meningkatkan efisiensi dan akurasi model,” tulis tim di sebuah blog. “Tetap disini untuk kemajuan kami pada proyek -proyek menarik ini.”