prévision du prix du vol
Projet SDAIA Bootcamp 2 - web scraping/régression linéaire.
Ce projet vise à prédire les prix des billets pour les vols à venir afin d'aider les clients à sélectionner le moment optimal pour voyager et le vol le moins cher vers la destination souhaitée. Un modèle de régression forestière aléatoire est appliqué pour prévoir les prix des vols sur la base des données extraites de Kayak.
Table des matières
- Proposition
- MVP
- Grattage
- Analyse et résultats
- Présentation
- Application mobile
- Auteurs
Proposition de projet
La proposition de projet peut être trouvée ici.
MVP du projet
Le MVP du projet peut être trouvé ici.
Grattage
Le carnet de notes Kayak Scraper peut être trouvé ici.
Voici une démo du grattoir en action (jouée à une vitesse 2x) :
Les données récupérées peuvent être trouvées ici.
Au total, les données comprennent 55 363 lignes et 7 colonnes.
Analyse et résultats
Le carnet de projet peut être consulté ici.
Les fonctionnalités sélectionnées sont :
- Source (4 sources ont été sélectionnées pour ce projet)
- Destination (4 destinations ont été sélectionnées pour ce projet)
- Nombre total d'arrêts
- Prix moyen par compagnie aérienne
- Durée
- Prix (cible)
Corrélation des fonctionnalités :
Expérimenter différents modèles :
Le modèle final sélectionné est le modèle de régression forestière aléatoire avec :
Métrique | Score |
---|
MAE | 61,87 |
MSE | 40409.87 |
RMSE | 201.02 |
Par conséquent, le modèle final est capable de prédire les prix des billets d’avion dans une fourchette d’environ ≈ 61,87 $.
Le modèle final peut être trouvé ici.
Présentation
La présentation peut être trouvée ici.
Application mobile
Nous avons également développé une application sur Android qui recherche les prix moyens estimés pour un itinéraire et un mois sélectionnés sur la base de nos données récupérées.
Ci-dessous, une démo de l'application mobile est présentée :
Auteurs
Meshal Alamr
Norah Alkhalifa