Laboratorium Kecerdasan Buatan Shanghai: Peningkatan model besar Cendekiawan Puyu - artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-01-28 18:32:01

Laboratorium Kecerdasan Buatan Shanghai baru-baru ini mengumumkan bahwa model sarjana yang dikembangkan sendiri telah menerima peningkatan besar dan meluncurkan versi baru Scholar Puyu 3.0 (InternLM3). Versi ini telah membuat terobosan signifikan dalam efisiensi penggunaan data dan kinerja model, mencapai kinerja lebih tinggi dengan biaya lebih rendah, dan untuk pertama kalinya mengintegrasikan dialog reguler dan kemampuan berpikir mendalam, secara signifikan meningkatkan kinerja model dalam skenario aplikasi nyata. Peningkatan ini tidak hanya mencapai terobosan teknologi, namun juga mencerminkan tekad dan kekuatan Tiongkok untuk terus berinovasi di bidang kecerdasan buatan.

Laboratorium Kecerdasan Buatan Shanghai mengumumkan bahwa model sarjananya telah menerima peningkatan versi penting dan meluncurkan Scholar Puyu 3.0 (InternLM3). Menurut laboratorium, versi baru ini telah meningkatkan efisiensi penggunaan data secara signifikan melalui kerangka data yang disempurnakan, sehingga mencapai peningkatan kepadatan berpikir.

Model InternLM3-8B-Instruct yang ditingkatkan hanya menggunakan 4T data untuk pelatihan. Para pejabat mengatakan kinerja komprehensifnya melebihi model sumber terbuka dengan ukuran yang sama, dan biaya pelatihan dihemat lebih dari 75%. Perlu dicatat bahwa versi ini untuk pertama kalinya mencapai integrasi dialog reguler dan kemampuan berpikir mendalam dalam model umum, yang dapat mengatasi beragam skenario penggunaan di kehidupan nyata dengan lebih baik.

Dalam hal evaluasi model, tim peneliti mengadopsi metode evaluasi yang terpadu dan dapat direproduksi berdasarkan kerangka evaluasi sumber terbuka Sinan OpenCompass. Konten evaluasi melibatkan lebih dari sepuluh rangkaian evaluasi otoritatif seperti CMMLU dan GPQA, yang mencakup berbagai dimensi seperti penalaran, matematika, pemrograman, mengikuti instruksi, pembuatan teks panjang, dialog, dan kinerja komprehensif. Hasil evaluasi menunjukkan bahwa Shusheng Puyu 3.0 memimpin skor di sebagian besar set evaluasi, dan kinerja keseluruhannya sangat mendekati GPT-4o-mini.

Shanghai AI Laboratory juga menyatakan bahwa model versi baru ini telah menjadi model dialog universal pertama di komunitas sumber terbuka yang mendukung penggunaan browser, dan dapat mendukung lompatan halaman web lebih dari 20 langkah, sehingga memungkinkan penambangan yang lebih mendalam. informasi.

Halaman pengalaman: https://internlm-chat.intern-ai.org.cn.

Menyorot:

Model Shusheng Puyu 3.0 dilatih dengan data 4T, dan performa komprehensifnya melebihi model sumber terbuka pada skala yang sama, sehingga menghemat lebih dari 75% biaya pelatihan.

Model ini mendapat skor terdepan dalam berbagai rangkaian evaluasi otoritatif, dan integrasi kemampuan berpikir dan dialog telah ditingkatkan secara signifikan.

Model baru ini mendukung penggunaan browser dan dapat melakukan penambangan informasi mendalam, menjadi salah satu hal yang menarik dari komunitas open source.

Secara keseluruhan, pemutakhiran Shusheng Puyu 3.0 menunjukkan kemajuan signifikan Tiongkok di bidang model bahasa skala besar. Metode pelatihan yang efisien dan kinerja yang kuat diharapkan dapat mendorong penerapan teknologi kecerdasan buatan di lebih banyak bidang, dan hal ini layak untuk dicermati maju untuk perkembangannya di masa depan.