مقدمة إلى التعلم الآلي باستخدام scikit-Learn
ستعلمك سلسلة الفيديو هذه كيفية حل مشكلات التعلم الآلي باستخدام مكتبة scikit-learn الشهيرة في Python. هناك 10 دروس فيديو يبلغ مجموعها 4.5 ساعة، كل منها مزود بمفكرة Jupyter المقابلة.
يمكنك مشاهدة السلسلة بأكملها على YouTube وعرض جميع دفاتر الملاحظات باستخدام nbviewer.
السلسلة متاحة أيضًا كدورة تدريبية مجانية عبر الإنترنت تتضمن محتوى محدثًا واختبارات وشهادة إكمال.
ملاحظة: تم تحديث دفاتر الملاحظات الموجودة في هذا المستودع لاستخدام Python 3.9.1 وscikit-learn 0.23.2. تستخدم دفاتر الملاحظات الأصلية (الموضحة في الفيديو) Python 2.7 وscikit-learn 0.16، ويمكن تنزيلها من فرع الأرشيف. يمكنك أن تقرأ عن كيفية تحديث الكود في منشور المدونة هذا.
جدول المحتويات
ما هو التعلم الآلي وكيف يعمل؟ (فيديو، دفتر)
- ما هو التعلم الآلي؟
- ما هي الفئتان الرئيسيتان للتعلم الآلي؟
- ما هي بعض الأمثلة على التعلم الآلي؟
- كيف "يعمل" التعلم الآلي؟
إعداد Python للتعلم الآلي: scikit-Learn وJupyter Notebook (فيديو، دفتر ملاحظات)
- ما هي فوائد وعيوب scikit-Learn؟
- كيف أقوم بتثبيت scikit-Learn؟
- كيف يمكنني استخدام Jupyter Notebook؟
- ما هي بعض الموارد الجيدة لتعلم بايثون؟
البدء في استخدام scikit-learn باستخدام مجموعة بيانات iris الشهيرة (فيديو، دفتر ملاحظات)
- ما هي مجموعة بيانات آيريس الشهيرة، وما علاقتها بالتعلم الآلي؟
- كيف يمكننا تحميل مجموعة بيانات القزحية في scikit-Learn؟
- كيف نصف مجموعة بيانات باستخدام مصطلحات التعلم الآلي؟
- ما هي المتطلبات الأربعة الرئيسية لـ scikit-Learn للتعامل مع البيانات؟
تدريب نموذج التعلم الآلي باستخدام scikit-Learn (فيديو ودفتر ملاحظات)
- ما هو نموذج تصنيف الجيران الأقرب إلى K؟
- ما هي الخطوات الأربع للتدريب النموذجي والتنبؤ في scikit-Learn؟
- كيف يمكنني تطبيق هذا النمط على نماذج التعلم الآلي الأخرى؟
مقارنة نماذج التعلم الآلي في scikit-Learn (فيديو، دفتر ملاحظات)
- كيف أختار النموذج الذي سأستخدمه في مهمة التعلم الخاضعة للإشراف؟
- كيف أختار أفضل معلمات الضبط لهذا النموذج؟
- كيف يمكنني تقدير الأداء المحتمل للنموذج الخاص بي على البيانات خارج العينة؟
خط أنابيب علوم البيانات: الباندا، سيبورن، سيكيت ليرن (فيديو، دفتر ملاحظات)
- كيف يمكنني استخدام مكتبة الباندا لقراءة البيانات في بايثون؟
- كيف يمكنني استخدام مكتبة Seaborn لتصور البيانات؟
- ما هو الانحدار الخطي وكيف يعمل؟
- كيف يمكنني تدريب وتفسير نموذج الانحدار الخطي في scikit-Learn؟
- ما هي بعض مقاييس التقييم لمشاكل الانحدار؟
- كيف أختار الميزات التي يجب تضمينها في النموذج الخاص بي؟
التحقق من الصحة لضبط المعلمة واختيار النموذج واختيار الميزات (فيديو، دفتر ملاحظات)
- ما هو عيب استخدام إجراء تقسيم التدريب/الاختبار لتقييم النموذج؟
- كيف يمكن للتحقق من صحة K-fold التغلب على هذا القيد؟
- كيف يمكن استخدام التحقق المتبادل لاختيار معلمات الضبط والاختيار بين النماذج واختيار الميزات؟
- ما هي بعض التحسينات الممكنة للتحقق المتبادل؟
البحث بكفاءة عن معلمات الضبط الأمثل (الفيديو، الكمبيوتر المحمول)
- كيف يمكن استخدام التحقق المتقاطع من K-fold للبحث عن معلمة الضبط الأمثل؟
- كيف يمكن جعل هذه العملية أكثر كفاءة؟
- كيف تبحث عن معلمات ضبط متعددة في وقت واحد؟
- ماذا تفعل مع معلمات الضبط هذه قبل إجراء تنبؤات حقيقية؟
- كيف يمكن تقليل التكلفة الحسابية لهذه العملية؟
تقييم نموذج التصنيف (فيديو، دفتر)
- ما هو الغرض من تقييم النموذج، وما هي بعض إجراءات التقييم الشائعة؟
- ما فائدة دقة التصنيف وما هي حدودها؟
- كيف تصف مصفوفة الارتباك أداء المصنف؟
- ما المقاييس التي يمكن حسابها من مصفوفة الارتباك؟
- كيف يمكنك ضبط أداء المصنف عن طريق تغيير عتبة التصنيف؟
- ما هو الغرض من منحنى ROC؟
- كيف تختلف المنطقة تحت المنحنى (AUC) عن دقة التصنيف؟
بناء سير عمل التعلم الآلي (فيديو، دفتر ملاحظات)
- لماذا يجب عليك استخدام خط الأنابيب؟
- كيف يمكنك تشفير الميزات الفئوية باستخدام OneHotEncoder؟
- كيف يمكنك تطبيق OneHotEncoder على الأعمدة المحددة باستخدام ColumnTransformer؟
- كيف يمكنك بناء خط أنابيب والتحقق من صحته؟
- كيف يمكنك عمل تنبؤات بشأن البيانات الجديدة باستخدام خط الأنابيب؟
- لماذا يجب عليك استخدام scikit-Learn (بدلاً من pandas) للمعالجة المسبقة؟
فيديو مكافأة
في مؤتمر PyCon 2016، قمت بتدريس برنامج تعليمي مدته 3 ساعات يعتمد على سلسلة مقاطع الفيديو هذه ويركز على البيانات المستندة إلى النص . يمكنك مشاهدة الفيديو التعليمي على موقع يوتيوب.
فيما يلي المواضيع التي تناولتها:
- بناء النماذج في برنامج scikit-learn (تجديدي)
- تمثيل النص كبيانات رقمية
- قراءة مجموعة بيانات نصية في الباندا
- توجيه مجموعة البيانات لدينا
- بناء وتقييم النموذج
- مقارنة النماذج
- فحص نموذج لمزيد من الرؤية
- ممارسة سير العمل هذا على مجموعة بيانات أخرى
- ضبط الناقل (مناقشة)
قم بزيارة مستودع GitHub هذا للوصول إلى دفاتر الملاحظات التعليمية والعديد من الموارد الأخرى الموصى بها.