โค้ดเบสขนาดเล็กที่ตีความได้ซึ่งมีการนำโมเดล NLP "เชิงลึก" บางส่วนไปใช้งานใหม่ใน PyTorch อีกครั้ง
สิ่งนี้ถูกนำเสนอเป็นจุดเริ่มต้น (ไม่สมบูรณ์) สำหรับผู้ที่สนใจเจาะลึกสถาปัตยกรรม DL ใน NLP มีการนำเสนอแบบจำลองที่มีคำอธิบายประกอบพร้อมกับหมายเหตุบางส่วน
มีลิงก์สำหรับเรียกใช้โมเดลเหล่านี้บน colab ด้วย GPU ⁉ ️ ผ่านทางโน้ตบุ๊ก
รุ่นปัจจุบัน : word2vec, CNN, หม้อแปลงไฟฟ้า, gpt ( งานอยู่ระหว่างดำเนินการ )
เบิร์ต: การอ่าน เข้าใจ.
หมายเหตุ: เป็น ของเล่น ของแต่ละรุ่น
แบบจำลอง NLP เหล่านี้นำเสนอตามลำดับเวลาและต่อยอดจากกันและกันอย่างที่คุณคาดหวัง
คลาสโมเดล | แบบอย่าง | ปี |
---|---|---|
การฝัง | ||
1. | การฝัง Word2Vec (การเรียนรู้ด้วยตนเอง) | 2013 |
ซีเอ็นเอ็น | ||
2. | การจำแนกข้อความตาม CNN (การจำแนกไบนารี) | 2014 |
หม้อแปลงไฟฟ้า | ||
3. | OG Transformer (การแปลด้วยเครื่อง) | 2017 |
4. | โมเดล GPT ของ OpenAI (โมเดลภาษา) | 2018, 2019, 2020 |
พื้นที่เก็บข้อมูลนี้มีคุณสมบัติดังต่อไปนี้:
หลังจากตรวจสอบโมเดลเหล่านี้แล้ว โลกก็เป็นหอยนางรมของคุณในแง่ของโมเดลอื่นๆ ที่น่าสำรวจ:
Char-RNN, BERT, ELMO, XLNET, BERT อื่นๆ ทั้งหมด, BART, นักแสดง, T5, ฯลฯ....
โมเดลในอนาคตที่จะนำไปใช้:
คุณสมบัติการซื้อคืนในอนาคต:
คุณสามารถติดตั้ง repo โดยใช้ pip
:
pip install git + https : // github . com / will - thompson - k / deeplearning - nlp - models
นี่คือรายละเอียดของที่เก็บ:
nlpmodels/models
: รหัสรุ่นสำหรับกระดาษแต่ละแผ่น nlpmodels/utils
: ประกอบด้วยคลาสเสริมทั้งหมดที่เกี่ยวข้องกับการสร้างแบบจำลอง รวมถึงชุดข้อมูล คำศัพท์ โทเค็นไนเซอร์ ตัวอย่าง และคลาสเทรนเนอร์ ( หมายเหตุ: ไฟล์ที่ไม่ใช่โมเดลส่วนใหญ่จะถูกโยนเข้าไปใน utils ฉันจะแนะนำไม่ให้ทำสิ่งนั้นใน repo ที่ใหญ่กว่า) tests
: ครอบคลุมแสงน้อย (และไม่ครอบคลุมทั้งหมด) notebooks
: ประกอบด้วยสมุดบันทึกและบทความสำหรับการใช้งานแต่ละรุ่นคำสั่งที่มีประโยชน์บางประการ:
make test
: เรียกใช้ชุดการทดสอบแบบเต็ม (คุณสามารถใช้ setup.py test
และ run_tests.sh
ได้เช่นกัน) make test_light
: รันการทดสอบทั้งหมด ยกเว้นการทดสอบการถดถอย make lint
: หากคุณชอบโค้ด linting จริงๆ (สามารถเรียกใช้ run_pylint.sh
ได้เช่นกัน) ไพธอน 3.6+
ข้อกำหนดแพ็กเกจต่อไปนี้ (ดูได้ใน Requirements.txt)
@ misc { deeplearning - nlp - models ,
author = { Thompson , Will },
url = { https : // github . com / will - thompson - k / deeplearning - nlp - models },
year = { 2020 }
}
เอ็มไอที