Englisch-Persian-Machine-Translation
Dieses Repository wird für das NLP -Kursprojekt - 2023 - durchgeführt.
- Übersetzen von englischer Text in Persisch mit Fairseq-Py.
Modelle
en-fa-mt_model1
- Die LSTM-Decoder-Code-Architektur enthält eine Encoder-Schicht und eine Decoderschicht mit Aufmerksamkeitsmechanismus
- Satzstückmodell wird für Byte-Pair-Coding-Daten (BPE) verwendet
- Zugmodell mit Fairseq-Py
en-fa-mt_model2
- Die LSTM-Decoder-Code-Architektur enthält eine Encoder-Schicht und eine Decoderschicht mit Aufmerksamkeitsmechanismus
- Bert-multinellierendes Basismodell-Tokenizer wird für Tokenize-Daten verwendet
- Zugmodell unter Verwendung von Fairseq-Py und unter Verwendung der Gewichte der Einbettungsschicht von Bert-multinellierenden Basismodell als Anfangswert des Modellgewichts
Daten
Der AFEC-Datensatz enthält ausgerichtete persische und englische Sätze und menschliche Sätze. Weitere Informationen zum AFEC -Datensatz finden Sie im Artikel