Basis kode kecil yang dapat ditafsirkan berisi implementasi ulang beberapa model NLP "mendalam" di PyTorch.
Ini disajikan sebagai titik awal (tidak lengkap) bagi mereka yang tertarik untuk mendalami arsitektur DL di NLP. Model beranotasi disajikan bersama dengan beberapa catatan.
Ada link untuk menjalankan model ini di colab dengan GPU ?️ melalui notebook.
Model saat ini : word2vec, CNN, transformator, gpt. ( Pekerjaan sedang berlangsung )
BERT: Membaca. Memahami.
Catatan: Ini adalah versi mainan dari masing-masing model.
Model NLP ini disajikan secara kronologis dan, seperti yang Anda duga, saling membangun.
Kelas Teladan | Model | Tahun |
---|---|---|
Penyematan | ||
1. | Penyematan Word2Vec (Pembelajaran dengan Pengawasan Mandiri) | 2013 |
CNN | ||
2. | Klasifikasi Teks Berbasis CNN (Klasifikasi Biner) | 2014 |
transformator | ||
3. | OG Transformer (Terjemahan Mesin) | 2017 |
4. | Model GPT OpenAI (Model Bahasa) | 2018, 2019, 2020 |
Repositori ini memiliki beberapa fitur berikut:
Setelah meninjau model-model ini, dunia adalah tiram Anda dalam hal model lain untuk dijelajahi:
Char-RNN, BERT, ELMO, XLNET, semua BERT lainnya, BART, Performer, T5, dll....
Model masa depan yang perlu diterapkan:
Fitur repo masa depan:
Anda dapat menginstal repo menggunakan pip
:
pip install git + https : // github . com / will - thompson - k / deeplearning - nlp - models
Berikut rincian repositorinya:
nlpmodels/models
: Kode model untuk setiap kertas. nlpmodels/utils
: Berisi semua kelas tambahan yang terkait dengan pembuatan model, termasuk kumpulan data, kosakata, tokenizer, sampler, dan kelas pelatih. ( Catatan: Sebagian besar file non-model dimasukkan ke dalam utils. Saya menyarankan agar tidak melakukannya di repo yang lebih besar.) tests
: Cakupan ringan (dan tidak komprehensif). notebooks
: Berisi buku catatan dan tulisan untuk setiap implementasi model.Beberapa perintah berguna:
make test
: Jalankan rangkaian pengujian lengkap (Anda juga dapat menggunakan setup.py test
dan run_tests.sh
). make test_light
: Jalankan semua pengujian kecuali pengujian regresi. make lint
: Jika Anda benar-benar menyukai kode linting (juga dapat menjalankan run_pylint.sh
). Python 3.6+
Berikut adalah persyaratan paket (ditemukan di persyaratan.txt)
@ misc { deeplearning - nlp - models ,
author = { Thompson , Will },
url = { https : // github . com / will - thompson - k / deeplearning - nlp - models },
year = { 2020 }
}
MIT