Model bahasa besar open source tencent HUNYUAN -Large mendukung hingga 256k urutan teks - artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-02-12 19:32:01

Tencent hari ini mengumumkan sumber terbuka dari model bahasa besar yang disebut HUNYUAN-Large, dengan skala parameter 398B dan volume parameter aktivasi 52B. Model ini berkinerja baik dalam berbagai tolok ukur otoritatif, melampaui model open source serupa seperti Llama 3.1 dan Mixtral. Inovasi teknologinya meliputi penerapan data sintetis berkualitas tinggi, yang secara efektif memecahkan masalah data alami yang tidak mencukupi dan mendukung urutan teks hingga 256k, secara signifikan meningkatkan kemampuan pemrosesan teks yang panjang. Selain itu, Tencent juga telah membuka set data evaluasi yang disebut "Penguin Scroll", yang bertujuan untuk menebus kurangnya set evaluasi teks panjang berkualitas tinggi di industri dan mempromosikan pengembangan teknologi model besar.

Tencent Today merilis model bahasa besar Source MOE HUNYUAN-Large, dengan volume parameter total 398B dan volume parameter aktivasi 52B. Hasil evaluasi publik menunjukkan bahwa Tencent Hunyuan Large memimpin di CMMLU, MMLU, CEVA1, Matematika dan set evaluasi komprehensif multidisiplin lainnya, serta sembilan dimensi seperti tugas NLP Cina dan Inggris seperti sebagai llama3.1 dan Mixtral.

Dapat dipahami bahwa model ini dapat mencapai data sintetis berkualitas tinggi dalam inovasi teknologi, dan secara efektif menangani kekurangan data alami melalui penggunaan data sintetis. Dalam hal kemampuan pemrosesan konteks, model pra-terlatih mendukung urutan teks hingga 256k, secara signifikan meningkatkan kemampuan untuk menangani tugas konteks yang panjang.

Pada saat yang sama, Tencent Hunyuan mengumumkan bahwa untuk mengisi kekurangan set tinjauan artikel yang nyata di industri ini, Tencent Hunyuan akan segera segera ditinjau oleh penguin source review gulir untuk membantu industri terapan terapan. Gulungan penguin yang dikembangkan sendiri didasarkan pada berbagai teks panjang alami seperti keuangan publik, hukum, dan makalah akademik.

Pelepasan model bahasa besar Tencent Huny Besar dan sumber terbuka set evaluasi gulir penguin akan memberikan industri dengan model bahasa yang lebih kuat dan alat evaluasi untuk mempromosikan pengembangan pemrosesan bahasa alami dan kecerdasan buatan.

Alamat situs web resmi: https://llm.hunyuan.tencent.com

Sumber terbuka Hunyuan-Large dan rilis simultan dari Penguin Scroll Review Set Mark terobosan besar lainnya untuk Tencent di bidang model bahasa besar, memberikan dukungan yang kuat untuk penelitian akademik dan aplikasi industri, dan ada baiknya menantikan masa depannya Pengembangan Kecerdasan Buatan.