كان هذا المشروع أحد المتطلبات الموجودة في وحدة الدراسات العليا التي تسمى الإحصائيات التطبيقية. الهدف الرئيسي من هذا المشروع هو إنشاء نموذج دقيق في التنبؤ بسعر تذكرة الطيران بناءً على الميزات. نماذج التعلم الآلي المستخدمة في هذا المشروع هي الانحدار الخطي البسيط والانحدار الخطي المتعدد. بالإضافة إلى ذلك ، يتم تنفيذ أجسام زمنية باستخدام Auto ARIMA للتنبؤ بسعر شركة طيران معينة في عام 2023. إن تدفق العملية الرئيسي لهذا المشروع هو إجراء تحليل للبيانات الاستكشافية ، والمعالجة المسبقة للبيانات ، وتحليل النموات ، والتدريب النموذجي ، وتحليل الأوقات ، واختبار الفرضية باستخدام ADF.
يتم ترميز المشروع بلغة R باستخدام R Studio IDE.
هناك مجموعة بيانات تستخدمان في هذا المشروع الموجودة في مجلد "Dataset".
يمكن عرض الرمز الكامل في ملف "code.r".
إذا كان أي شخص يريد استخدام جزء من الكود. الرجاء الرجوع إليها. شكرًا.
تشير الأبحاث الحالية داخل هذا المجال إلى أنه يمكن التنبؤ بأسعار تذاكر الطيران باستخدام مجموعة من الميزات التي يمكن أن تكون شركات وسائح مفيدة لاستنتاج السعر ومتى يكون أفضل وقت لشراء تذكرة طيران. نظرًا لأن سعر تذكرة الطيران يتقلب حيث يتم تطبيق سعر موسمي من وقت لآخر ، فمن الصعب الحصول على تنبؤ دقيق. وبالتالي ، فإن السؤال الرئيسي الآن هو أنه من الممكن التنبؤ بسعر التذكرة بناءً على الميزات المتعلقة بالرحلة نفسها مثل مدة الرحلة ، وعدد التوقف ، وما إلى ذلك.
أثناء تحليل الارتباط ، يتم تحديد ارتباط إيجابي قوي قدره 0.92 بين متوسط السعر والأيام المتبقية المتبقية لشراء التذكرة. كان هذا هو الأقوى من بين جميع الارتباطات التي تأسست. اكتشف تحليل الانحدار الخطي أن ميزة "متوسط السعر" و "days_left" يمكن أن تفسر 62.53 ٪ من تباين "متوسط السعر". علاوة على ذلك ، توقع تحليل Timeseries أنه في أبريل 2023 ، يبلغ سعر التذاكر لـ Jet Airways 12431.34 دولار.
بشكل عام ، تستنتج النتائج الواردة في هذا المشروع أنه يمكن استخدام الميزات للتنبؤ بسعر تذكرة الطيران. ومع ذلك ، يمكن النظر في المزيد من الميزات مثل حالة الطقس أو توسيع مجموعة البيانات أكثر مع المتغيرات العددية للتنبؤ بنتيجة أكثر دقة.
يغطي المشروع جميع العملية من المعالجة المسبقة للبيانات إلى تطوير نموذج الانحدار الخطي. تشمل النتائج الموجودة في هذا المشروع جميع الأسئلة الإحصائية المذكورة سابقًا. تم إجراء المعالجة المسبقة للبيانات لتحويل البيانات إلى معيار مناسب لنموذج الانحدار الخطي. يتم إكمال تحليل الارتباط لتحديد المتغيرات التي تعتمد بقوة على بعضها البعض والتي هي مفيدة لتحليل الانحدار الخطي. استنادًا إلى تحليل الارتباط ، تم إنشاء نموذج الانحدار الخطي لأداء التنبؤ على تذكرة سعر رحلة الطيران. بالإضافة إلى ذلك ، يتم إجراء تحليل للأوقات للتنبؤ بسعر تذكرة طيران الخطوط الجوية Jet Airways في عام 2023 وهو 12431.34 دولار. أخيرًا ، يتم إجراء اختبار الفرضية باستخدام Dickey Fuller المعزز (ADF) أو اختبار جذر الوحدة لتحديد ما إذا كانت الأوقات ثابتة أم لا.
بشكل عام ، يمكن للميزات المقدمة استنتاج تذكرة سعر الخطوط الجوية. ومع ذلك ، لا يتم استخدام جميع الميزات وقوية بما يكفي لتحقيق هذه المهمة. وبالتالي ، يمكن إجراء تحسين في المستقبل حيث يمكن النظر في المزيد من العوامل مثل حالة الطقس أو توسيع مجموعة البيانات أكثر مع متغيرات عددية أكثر والتي يمكن استخدامها للتنبؤ بنتيجة أكثر دقة.