Отечественные крупные модели активно изучают способы превзойти GPT-4. Однако существующие методы оценки имеют ограничения, такие как утечки при тестировании и недостаточный уровень доверия. Чтобы стандартизировать оценку больших моделей и обеспечить более надежный ориентир для развития отрасли, крайне важно объективно и справедливо оценивать технический уровень больших моделей. В этой статье будут обсуждаться состояние разработки и проблемы отечественных больших моделей.
Отечественные большие модели изучают способы превзойти GPT4, а различные методы оценки раскрывают возможности больших моделей, но есть утечки тестов и сомнения в достоверности. Китайская академия информационных и коммуникационных технологий опубликовала национальный план стандартов, призванный обеспечить официальный и авторитетный стандарт для оценки больших моделей.
План национального стандарта, выпущенный Китайской академией информационных и коммуникационных технологий, обеспечивает важную гарантию здорового развития отечественных крупных моделей и знаменует собой ключевой шаг в области оценки крупных моделей в моей стране. В будущем более полная система оценки будет продолжать способствовать технологическому прогрессу отечественных крупных моделей и, в конечном итоге, достигать конкуренции и превосходить международный передовой уровень.