Model-model besar dalam negeri secara aktif mencari cara untuk melampaui GPT-4. Namun, metode evaluasi yang ada memiliki keterbatasan, seperti kebocoran pengujian dan kredibilitas yang tidak memadai. Untuk membakukan evaluasi model besar dan memberikan referensi yang lebih andal untuk pengembangan industri, penting untuk mengevaluasi tingkat teknis model besar secara obyektif dan adil. Artikel ini akan membahas status perkembangan dan tantangan model besar dalam negeri.
Model-model besar dalam negeri sedang mencari cara untuk mengungguli GPT4, dan berbagai metode evaluasi mengungkapkan kemampuan model-model besar, namun terdapat kebocoran pengujian dan keraguan kredibilitas. Akademi Teknologi Informasi dan Komunikasi Tiongkok telah merilis rencana standar nasional untuk memberikan standar resmi dan otoritatif untuk evaluasi model besar.
Rencana standar nasional yang dikeluarkan oleh Akademi Teknologi Informasi dan Komunikasi Tiongkok memberikan jaminan penting bagi pengembangan model besar dalam negeri yang sehat dan menandai langkah penting dalam bidang evaluasi model besar di negara saya. Di masa depan, sistem evaluasi yang lebih lengkap akan terus mendorong kemajuan teknologi model besar dalam negeri, dan pada akhirnya mencapai persaingan dan melampaui tingkat mahir internasional.