Recentemente, a Tencent Technology (Shenzhen) Co., Ltd., solicitou uma patente chamada "Métodos de treinamento, dispositivos, equipamentos de computador e mídia de armazenamento para grandes modelos de idiomas". Esta patente fornece informações mais aprendidas para o modelo durante o treinamento do grande modelo de linguagem, introduzindo o primeiro texto abstrato e o segundo texto abstrato.
De acordo com a descrição da patente, o primeiro texto abstrato e o segundo texto abstrato contêm diferentes quantidades de informação, e o primeiro texto abstrato também contém declarações corretas e declarações incorretas. Ao comparar e aprender esses dois resumos diferentes do mesmo texto e distinguir as declarações corretas e as declarações erradas nelas, podemos efetivamente evitar os possíveis problemas, como o excesso de ajuste do modelo e a geração imprecisa causada pelo texto de resumo único.
A inovação desse método é que ele melhora o desempenho da generalização do modelo e melhora efetivamente a precisão do modelo. Ao introduzir diversos conteúdo de texto abstrato, o método de treinamento da Tencent trouxe melhorias mais eficientes e precisas para o processo de treinamento de grandes modelos de linguagem.
Esse progresso não apenas reflete a força técnica de Tencent no campo da inteligência artificial, mas também estabelece uma base sólida para a aplicação e desenvolvimento de grandes modelos de linguagem no futuro.