Os resultados mais recentes da pesquisa das equipes Meta e NYU são atraentes. Eles propuseram um método inovador para tornar grandes modelos "auto-recompensados" e aplicaram-no com sucesso ao modelo Llama2. Este avanço tecnológico permitiu ao Llama2 superar modelos líderes como GPT-40613, Claude2 e Gemini Pro em vários testes de benchmark, tornando-se o foco do atual campo de IA. Esta conquista marca um progresso significativo na tecnologia de grandes modelos de auto-iteração de IA e anuncia uma nova direção para o desenvolvimento futuro da IA.
Recentemente, as equipes Meta e NYU propuseram um método para que grandes modelos se "recompensassem". Através deste método, Llama2 derrotou os modelos líderes GPT-40613, Claude2 e GeminiPro de uma só vez, tornando-se o foco do mundo da IA. A pesquisa mostra que este trabalho da Meta é um grande passo em frente no avanço da fronteira de grandes modelos de auto-iteração de IA.
Este resultado de pesquisa das equipes Meta e NYU fornece novas ideias e métodos para a auto-iteração de grandes modelos de IA. No futuro, espera-se melhorar ainda mais o desempenho e a eficiência dos modelos de IA e promover o desenvolvimento sustentável da tecnologia de inteligência artificial. . O sucesso do Llama2 também proporcionou experiência valiosa e referência para outras equipes de pesquisa de IA. Acredito que, num futuro próximo, veremos o surgimento de modelos de IA mais avançados baseados em mecanismos de auto-recompensa.