Translation de l'anglais-personne-machine
Ce référentiel est conçu pour le projet de cours NLP - 2023.
- Traduction de texte anglais en persan en utilisant Fairseq-Py.
Modèles
en-fa-mt_model1
- L'architecture de décodeur LSTM comprend une couche d'encodeur et une couche de décodeur avec mécanisme d'attention
- Le modèle de phrase est utilisé pour les données de codage de byte-paire (BPE)
- Modèle de train utilisant Fairseq-Py
en-fa-mt_model2
- L'architecture de décodeur LSTM comprend une couche d'encodeur et une couche de décodeur avec mécanisme d'attention
- Le jetons de modèle de base de base bert-multilingue est utilisé pour les données de tokenize
- Modèle de train utilisant Fairseq-Py et en utilisant les poids de la couche d'incorporation du modèle de base de la base de bert-multitilingues comme valeur initiale des poids du modèle
Données
L'ensemble de données AFEC comprend des phrases persanes et anglaises alignées et des phrases traditionnelles humaines. Pour plus d'informations sur l'ensemble de données AFEC, vous pouvez lire son article