Investigadores de la Universidad de Washington proponen un método innovador de ajuste de agentes que optimiza de manera eficiente modelos de lenguaje grandes sin requerir acceso a los pesos del modelo. Este método guía las predicciones del modelo base hacia el modelo sintonizado comparando las predicciones de un modelo sintonizado pequeño y un modelo no sintonizado, mejorando así el rendimiento del modelo y reteniendo mejor el conocimiento del entrenamiento. Esta innovadora tecnología se verificó en experimentos de ajuste en los modelos originales 13B y 70B de LLAMA-2, lo que demuestra sus importantes ventajas de eficiencia.
Webmaster Home informó que la Universidad de Washington lanzó un método de ajuste proxy que puede lograr un ajuste eficiente de modelos grandes sin tocar los pesos del modelo al comparar los resultados de predicción de modelos pequeños ajustados y modelos no ajustados. Este método puede retener mejor los conocimientos de formación durante la decodificación y mejorar la eficiencia de la sintonización. El rendimiento de ajuste del agente fue verificado por investigadores que ajustaron los modelos originales 13B y 70B de LlAMA-2. Este método compara las distribuciones de predicción de salida del modelo básico M y el modelo de ajuste M+, y guía las predicciones del modelo básico para que avancen en la dirección del modelo de ajuste. Es un método de ajuste innovador. El método de ajuste del agente proporciona una solución para el ajuste eficiente de modelos grandes y, al mismo tiempo, retiene mejor el conocimiento del entrenamiento durante la decodificación, lo que se espera que aporte nuevos conocimientos al campo de la IA.Este nuevo método proporciona una forma más conveniente y eficiente para el ajuste de modelos grandes, reduce la necesidad de manipulación directa de los pesos del modelo y mejora efectivamente el rendimiento del modelo y las capacidades de retención de conocimiento, brindando nuevas posibilidades al desarrollo del campo de la inteligencia artificial. En el futuro, se espera que este método se aplique en ajustes de modelos de lenguaje a mayor escala, promoviendo aún más el progreso de la tecnología de IA.