كابينة الاشتراك
يحتوي مجلد جيثب على:
- R رمز المشروع في ".r format": التنبؤ أجرة الكابينة باستخدام RR
- رمز Python للمشروع في '.ipynb format': التنبؤ بأجرة الكابينة باستخدام python.ipynb
- تقرير المشروع: التنبؤ بأجرة الكابينة. pdf
- بيان مشكلة. pdf
- النموذج المحفوظ المدرب على مجموعة بيانات التدريب بأكملها من Python: CAB_FARE_XGBOOST_MODEL.RAR
- النموذج المحفوظ المدرب على مجموعة بيانات التدريب بأكملها من Python: Final_xgboost_model_using_r.rar
- تنبؤات على مجموعة بيانات الاختبار بتنسيق CSV: التنبؤات _xgboost.csv
بيان المشكلة
الهدف من هذا المشروع هو التنبؤ بمبلغ أجرة الكابينة بناءً على سمات البيانات التالية في مجموعة البيانات على النحو التالي:
pickup_datetime - timestamp value indicating when the cab ride started.
pickup_longitude - float for longitude coordinate of where the cab ride started.
pickup_latitude - float for latitude coordinate of where the cab ride started.
dropoff_longitude - float for longitude coordinate of where the cab ride ended.
dropoff_latitude - float for latitude coordinate of where the cab ride ended.
passenger_count - an integer indicating the number of passengers in the cab ride.
إنها مشكلة الانحدار.
جميع الخطوات التي تم تنفيذها في هذا المشروع
- البيانات المسبقة للبيانات.
- تصور البيانات.
- التحليل الخارجي.
- تحليل القيمة المفقودة.
- اختيار الميزة.
- تحليل الارتباط.
- اختبار تشي مربع.
- تحليل التباين (ANOVA) اختبار
- اختبار multicollinarity.
- ميزة التحجيم.
- الانقسام إلى مجموعة بيانات القطار والتحقق من الصحة.
- التحسين Hyperparameter.
- النموذج التنمية I. الانحدار الخطي الثاني. ريدج الانحدار الثالث. Lasso الانحدار الرابع. شجرة القرار V. غابة عشوائية
- تحسين الدقة أ) ضبط الخوارزمية ب) المجموعات ------ XgBoost للانحدار اللمسات الأخيرة
- كود بيثون