Recientemente, Tencent Technology (Shenzhen) Co., Ltd. solicitó una patente llamada "Métodos de capacitación, dispositivos, equipos informáticos y medios de almacenamiento para modelos de idiomas grandes". Esta patente proporciona más información aprendible para el modelo durante la capacitación del modelo de lenguaje grande al introducir el primer texto abstracto y el segundo texto abstracto.
Según la descripción de la patente, el primer texto abstracto y el segundo texto abstracto contienen diferentes cantidades de información, y el primer texto abstracto también contiene declaraciones correctas y declaraciones incorrectas. Al comparar y aprender estos dos resúmenes diferentes del mismo texto y distinguir las declaraciones correctas y las declaraciones incorrectas en ellas, podemos evitar efectivamente los posibles problemas, como el sobreajuste del modelo y la generación inexacta causada por el texto de resumen único.
La innovación de este método es que mejora el rendimiento de generalización del modelo y mejora efectivamente la precisión del modelo. Al introducir diversos contenido de texto abstracto, el método de capacitación de Tencent ha traído mejoras más eficientes y precisas al proceso de capacitación de modelos de idiomas grandes.
Este progreso no solo refleja la fuerza técnica de Tencent en el campo de la inteligencia artificial, sino que también sienta una base sólida para la aplicación y el desarrollo de grandes modelos de idiomas en el futuro.