Descargar reweight gpt - descargar código fuente reweight gpt

Español

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Inicio>Relacionado con la programación>Otro código fuente

reweight gpt

Otro código fuente

1.0.0

Descargar

Reponderar GPT

Una alternativa al mecanismo de autoatención en la arquitectura Tranformer. Utiliza conexiones laterales que se pueden aprender para reponderar las entradas directamente en lugar del mecanismo de autoatención (como se ilustra a continuación). Para obtener más información sobre el método, mire este video (de 41:26): https://youtu.be/l-CjXFmcVzY

Archivos:

la carpeta del tutorial: un tutorial paso a paso desde los conceptos básicos hasta GPT.
reweight-gpt.py (Una implementación de GPT multibloque que utiliza la reponderación directa de la matriz de atención).
reweight-gpt-nonlinear.py (Una versión no lineal del método de reponderación directa. Para facilitar la comparación entre los dos métodos, adapté este script directamente de la implementación de GPT de Andrej Karpathy).