مرحبًا بكم في النظرية والخبرة العملية في البرمجة اللغوية العصبية.
في هذا المستودع، قمت بتغطية كل ما تحتاجه تقريبًا للبدء في عالم البرمجة اللغوية العصبية (NLP)، بدءًا من Tokenizers إلى Transformer Architecuture. بحلول الوقت الذي تنتهي فيه من هذا، سيكون لديك فهم قوي للمفاهيم الأساسية للبرمجة اللغوية العصبية.
الهدف من هذا المستودع هو إعطائك الحدس الأساسي وفي نهاية هذا ستعرف كيف تطورت الأشياء على مر السنين ولماذا هي على ما هي عليه الآن.
الصورة التي تم إنشاؤها بواسطة Ideogram
جدول المحتويات
1. الترميز
2. المعالجة المسبقة
3. حقيبة الكلمات والمشابهة
4. TF-IDF والبحث عن الوثائق
5. تصنيف نص ساذج بايز
6. نمذجة موضوع LDA
7. تضمين الكلمات
8. الشبكات العصبية المتكررة (RNNs) ونمذجة اللغة
9. الترجمة الآلية والاهتمام
10. المحولات
كيف يمكنني استخدام هذا المستودع؟
بالنظر إلى القوة الحسابية المطلوبة لتعلم التعلم والتعلم، يُنصح باستخدام Google Colab أو Kaggle Kernels.
يمكنك النقر فوق لفتح دفتر الملاحظات في Colab.
يمكنك النقر فوق لفتح دفتر الملاحظات في Kaggle.
بالنسبة لبعض دفاتر الملاحظات، يتم استخدام مجموعات بيانات Kaggle، وبعضها بالجيجابايت.
لتحميل مجموعات البيانات هذه بشكل أسرع، يُنصح بفتحها في Kaggle باستخدام العلامات المقابلة.
لا يؤدي فتح Kaggle Kernel إلى إرفاق مجموعة البيانات المطلوبة للكمبيوتر الدفتري مباشرةً.
يتعين عليك إرفاق مجموعة البيانات التي تم توفير رابطها في دفاتر الملاحظات المعنية، والتي ستجدها أثناء تقدمك فيها.
ابدأ باستخدام Tokenization Notebook ثم تقدم للأمام بالتسلسل.
خذ وقتك لفهم المفاهيم والتعليمات البرمجية. لقد تم تصميمه خصيصًا ليكون سهل الفهم ويمكن تنفيذه بالسرعة التي تناسبك.
تأكد من أن لديك فهمًا أساسيًا لبرمجة بايثون قبل البدء.
إذا واجهت أي مشكلات أو كانت لديك أسئلة، فلا تتردد في فتح مشكلة في مستودع GitHub.
لا تنسَ تمييز المستودع بنجمة إذا وجدت أنه مفيد!
المساهمة
أنت مرحب بك للمساهمة في هذا المستودع. يمكنك البدء بفتح مشكلة أو إرسال طلب سحب. إذا كانت لديك أي أسئلة، فلا تتردد في التواصل معي على X
إذا كان لديك أي موارد تعتقد أنها ستكون مفيدة للآخرين، فلا تتردد في فتح مشكلة أو إرسال طلب سحب.
رخصة
هذا المشروع مرخص بموجب ترخيص MIT - راجع ملف الترخيص للحصول على التفاصيل.