Cendekiawan Puyu 2.5 sumber terbuka ultra-ringan 1,8B, versi beberapa parameter 20B berkinerja tinggi

Penulis：Eve Cole Waktu Pembaruan：2024-12-06 17:16:01

Laboratorium Kecerdasan Buatan Shanghai merilis versi terbaru model seri Scholar Puyu, InternLM2.5, di Forum Utama WAIC Science Frontier pada 4 Juli 2024. Kemampuan penalaran versi ini dalam skenario yang kompleks telah ditingkatkan secara signifikan, mendukung konteks ultra-panjang 1M, dan dapat melakukan pencarian Internet dan integrasi informasi secara mandiri, yang merupakan terobosan besar. Editor Downcodes akan menjelaskan secara rinci fungsi dan informasi open source InternLM2.5.

Laboratorium Kecerdasan Buatan Shanghai meluncurkan versi baru model seri Scholar Puyu, InternLM2.5, di Forum Utama WAIC Science Frontier pada 4 Juli 2024. Kemampuan penalaran versi ini dalam skenario kompleks telah ditingkatkan secara komprehensif, mendukung konteks ultra-panjang 1M, dan dapat melakukan pencarian Internet secara mandiri dan mengintegrasikan informasi dari ratusan halaman web.

InternLM2.5 merilis tiga versi parameter model, yaitu 1.8B, 7B dan 20B, untuk beradaptasi dengan skenario aplikasi dan kebutuhan pengembang yang berbeda. Versi 1.8B adalah model ultra-ringan, sedangkan versi 20B memberikan kinerja komprehensif yang lebih kuat dan mendukung skenario praktis yang lebih kompleks. Semua model ini bersifat open source dan dapat ditemukan di beranda model besar seri Scholar·Puyu, beranda ModelScope, dan beranda Hugging Face.

InternLM2.5 melakukan iterasi pada beberapa teknologi sintesis data, sehingga secara signifikan meningkatkan kemampuan penalaran model. Secara khusus, tingkat akurasi pada set evaluasi matematika MATH mencapai 64,7%. Selain itu, model ini meningkatkan kemampuan pemrosesan panjang konteks melalui pelatihan yang efisien pada tahap pra-pelatihan.

Model seri InternLM2.5 juga mencapai integrasi yang mulus dengan kerangka kerja inferensi dan penyempurnaan hilir, termasuk kerangka kerja penyempurnaan XTuner dan kerangka inferensi LMDeploy yang dikembangkan secara independen oleh Shanghai Artificial Intelligence Laboratory, serta kerangka kerja lain dengan basis pengguna yang luas di Shanghai. komunitas seperti vLLM dan Ollama. Alat SWIFT yang diluncurkan oleh komunitas Moda juga mendukung inferensi, penyesuaian, dan penerapan model seri InternLM2.5.

Pengalaman penerapan model ini mencakup penalaran kompleks multi-langkah, pemahaman yang tepat tentang maksud percakapan multi-putaran, operasi kontrol format yang fleksibel, dan kemampuan untuk mengikuti instruksi yang kompleks. Panduan instalasi dan penggunaan terperinci disediakan untuk memfasilitasi pengembang untuk memulai dengan cepat.

Halaman beranda model besar seri Scholar·Puyu:

https://internlm.intern-ai.org.cn

Halaman Beranda ModelScope:

https://www.modelscope.cn/organization/Shanghai_AI_Laboratory?tab=model

Halaman Beranda Memeluk Wajah:

https://huggingface.co/internlm

Tautan sumber terbuka InternLM2.5:

https://github.com/InternLM/InternLM

Rilis open source InternLM2.5 membawa kemungkinan baru untuk penelitian dan aplikasi di bidang kecerdasan buatan. Performanya yang kuat dan kemudahan penggunaannya diyakini akan menarik banyak pengembang untuk mengeksplorasi dan berinovasi. Editor Downcodes berharap dapat melihat lebih banyak aplikasi unggulan berdasarkan InternLM2.5!