การประมวลผลภาษาธรรมชาติ: Zero to Hero!
ยินดีต้อนรับสู่ทฤษฎีและประสบการณ์จริงของ NLP
ในที่เก็บข้อมูลนี้ ฉันได้ครอบคลุมเกือบทุกอย่างที่คุณต้องการเพื่อเริ่มต้นในโลกของ NLP ตั้งแต่ Tokenizers ไปจนถึง Transformer Architecuture เมื่อเสร็จสิ้น คุณจะเข้าใจแนวคิดหลักของ NLP อย่างมั่นคง
จุดประสงค์ของพื้นที่เก็บข้อมูลนี้คือเพื่อให้คุณมีสัญชาตญาณหลัก และเมื่อสิ้นสุดสิ่งนี้ คุณจะรู้ว่าสิ่งต่างๆ พัฒนาไปอย่างไรตลอดหลายปีที่ผ่านมา และเหตุใดมันจึงเป็นอย่างที่มันเป็น
รูปภาพที่สร้างโดย Ideogram
สารบัญ
1. โทเค็น
2. การประมวลผลล่วงหน้า
3. ถุงคำและความคล้ายคลึงกัน
4. TF-IDF และการค้นหาเอกสาร
5. การจำแนกข้อความ Naive Bayes
6. การสร้างแบบจำลองหัวข้อ LDA
7. การฝังคำ
8. โครงข่ายประสาทเทียมที่เกิดซ้ำ (RNN) และการสร้างแบบจำลองภาษา
9. การแปลด้วยเครื่องและความสนใจ
10. หม้อแปลงไฟฟ้า
ฉันจะใช้พื้นที่เก็บข้อมูลนี้ได้อย่างไร
- เมื่อพิจารณาถึงพลังการคำนวณที่จำเป็นสำหรับ ML และ DL ขอแนะนำให้ใช้ Google Colab หรือ Kaggle Kernels
- คุณสามารถคลิกเพื่อเปิดสมุดบันทึกใน Colab
- คุณสามารถคลิกเพื่อเปิดสมุดบันทึกใน Kaggle
- สำหรับโน้ตบุ๊กบางรุ่น จะใช้ชุดข้อมูล Kaggle และบางชุดมีหน่วยเป็นกิกะไบต์
- เพื่อให้การโหลดชุดข้อมูลเหล่านั้นเร็วขึ้น ขอแนะนำให้เปิดชุดข้อมูลเหล่านั้นใน Kaggle โดยใช้แท็กที่เกี่ยวข้อง
- การเปิดเคอร์เนล Kaggle ไม่ได้แนบชุดข้อมูลที่จำเป็นสำหรับโน้ตบุ๊กโดยตรง
- คุณจะต้องแนบชุดข้อมูลที่มีลิงก์ระบุไว้ในสมุดบันทึกที่เกี่ยวข้อง ซึ่งคุณจะพบได้เมื่อคุณดำเนินการผ่านชุดข้อมูลเหล่านั้น
- เริ่มต้นด้วย
Tokenization
Notebook และก้าวไปข้างหน้าตามลำดับ - ใช้เวลาทำความเข้าใจแนวคิดและโค้ด ออกแบบมาโดยเฉพาะเพื่อให้เข้าใจง่ายและทำได้ตามที่คุณต้องการ
- ตรวจสอบให้แน่ใจว่าคุณมีความเข้าใจพื้นฐานเกี่ยวกับการเขียนโปรแกรม Python ก่อนเริ่มต้น
- หากคุณพบปัญหาหรือมีคำถามใดๆ โปรดอย่าลังเลที่จะเปิดปัญหาในพื้นที่เก็บข้อมูล GitHub
- อย่าลืมติดดาวพื้นที่เก็บข้อมูลหากคุณพบว่ามีประโยชน์!
มีส่วนร่วม
คุณยินดีอย่างยิ่งที่จะมีส่วนร่วมในพื้นที่เก็บข้อมูลนี้ คุณสามารถเริ่มต้นด้วยการเปิดประเด็นหรือส่งคำขอดึงข้อมูล หากคุณมีคำถามใดๆ โปรดติดต่อฉันทาง X
หากคุณมีทรัพยากรใดๆ ที่คุณคิดว่าจะเป็นประโยชน์สำหรับผู้อื่น โปรดเปิดประเด็นหรือส่งคำขอดึงข้อมูลได้เลย
ใบอนุญาต
โครงการนี้ได้รับอนุญาตภายใต้ใบอนุญาต MIT - ดูรายละเอียดในไฟล์ใบอนุญาต
ประวัติดารา