reweight gpt Télécharger - reweight gpt Téléchargement du code source

Français

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

Page d'accueil>Lié à la programmation>Autre code source

reweight gpt

Autre code source

1.0.0

Télécharger

Repondérer les tags GPT

Une alternative au mécanisme d’auto-attention dans l’architecture Transformer. Il utilise des connexions latérales apprenables pour repondérer les entrées directement au lieu du mécanisme d'auto-attention (comme illustré ci-dessous). Pour en savoir plus sur la méthode, regardez cette vidéo (à partir de 41:26) : https://youtu.be/l-CjXFmcVzY

Fichiers :

le dossier du didacticiel - Un didacticiel étape par étape depuis les bases jusqu'au GPT.
reweight-gpt.py (Une implémentation GPT multibloc utilisant une repondération directe de la matrice d'attention).
reweight-gpt-nonlinear.py (Une version non linéaire de la méthode de repondération directe. Pour une comparaison facile entre les deux méthodes, j'ai adapté ce script directement à partir de l'implémentation GPT d'Andrej Karpathy).