Télécharger Transformer Architectures From Scratch - Transformer Architectures From Scratch Téléchargement du code source

Transformer Architectures From Scratch

Autre code source

1.0.0

Télécharger

Architecture de transformateur à partir de zéro à l'aide de PyTorch

1) TRANSFORMATEUR -

Une architecture d'encodeur-décodeur basée sur l'auto-attention. Il est surtout utilisé pour

Traduction automatique
Résumé du document
Extraction de texte

Papier - https://arxiv.org/abs/1706.03762

2) BERTE -

Une architecture d'encodeur basée sur l'auto-attention. Il est surtout utilisé pour

Classification des sentiments
Reconnaissance d'entité nommée
Questions et réponses
Extraction d'incorporation de phrases
Correspondance de documents

Papier - https://arxiv.org/abs/1810.04805

3) GPT-1 -

Un modèle autorégressif basé sur un décodeur basé sur l'auto-attention. Il est surtout utilisé pour

Achèvement de la phrase
Générer du texte
Classification des sentiments

Papier - https://paperswithcode.com/method/gpt

4) GPT-2 -

Un modèle autorégressif basé sur un décodeur basé sur l'auto-attention avec un léger changement d'architecture et formé sur un corpus de texte plus grand que GPT-1. Il est surtout utilisé pour

Achèvement de la phrase
Générer du texte
Classification des sentiments

Article - https://d4mucfpksywv.cloudfront.net/better-langage-models/langage-models.pdf

5) Vit -

Une architecture d'encodeur de pointe basée sur l'auto-attention pour les applications de vision par ordinateur. Il est surtout utilisé pour

Classement des images
Encodage d'images
Backbone pour la détection d'objets

Article - https://arxiv.org/abs/2006.03677

6) INTERPRÈTE -

Une architecture de codeur-décodeur basée sur l'auto-attention avec une complexité temporelle linéaire autre que le transformateur qui a une complexité temporelle quadratique. On l'utilise surtout