Os grandes modelos nacionais estão a explorar activamente formas de ultrapassar o GPT-4. No entanto, os métodos de avaliação existentes têm limitações, tais como fugas de teste e credibilidade insuficiente. A fim de padronizar a avaliação de grandes modelos e fornecer uma referência mais confiável para o desenvolvimento da indústria, é crucial avaliar de forma objetiva e justa o nível técnico dos grandes modelos. Este artigo discutirá o status de desenvolvimento e os desafios dos grandes modelos nacionais.
Grandes modelos nacionais estão explorando maneiras de superar o GPT4, e vários métodos de avaliação revelam as capacidades dos grandes modelos, mas há vazamentos de testes e dúvidas de credibilidade. A Academia Chinesa de Tecnologia da Informação e Comunicação lançou um plano de padrão nacional para fornecer um padrão oficial e confiável para avaliação de grandes modelos.
O plano padrão nacional emitido pela Academia Chinesa de Tecnologia da Informação e Comunicação fornece uma garantia importante para o desenvolvimento saudável de grandes modelos nacionais e marca um passo fundamental no campo da avaliação de grandes modelos no meu país. No futuro, um sistema de avaliação mais completo continuará a promover o progresso tecnológico dos grandes modelos nacionais e, em última análise, alcançará a concorrência e superará o nível avançado internacional.