Homemade GPT
1.0.0
Ce référentiel contient une implémentation Python de la partie Decoder de l'architecture Transformer introduite dans l'article fondateur - L'attention est tout ce dont vous avez besoin. La figure 1 montre l'architecture complète du transformateur avec le bloc Encoder à gauche et le bloc Decoder à droite.
Le modèle est affiné sur l'ensemble de données d'instructions Alpaca à l'aide du style d'invite Alpaca.