Flugpreisvorhersage
SDAIA Bootcamp-Projekt 2 – Web Scraping/lineare Regression.
Dieses Projekt zielt darauf ab, Ticketpreise für bevorstehende Flüge vorherzusagen, um Kunden bei der Auswahl der optimalen Reisezeit und des günstigsten Fluges zum gewünschten Ziel zu helfen. Ein Random-Forest-Regressionsmodell wird angewendet, um die Flugpreise basierend auf den von Kayak erfassten Daten vorherzusagen.
Inhaltsverzeichnis
- Vorschlag
- MVP
- Schaben
- Analyse und Ergebnisse
- Präsentation
- Mobile App
- Autoren
Projektvorschlag
Den Projektvorschlag finden Sie hier.
Projekt-MVP
Den Projekt-MVP finden Sie hier.
Schaben
Das Kayak Scraper Notebook finden Sie hier.
Hier ist eine Demo des Scrapers in Aktion (gespielt mit 2-facher Geschwindigkeit):
Die gescrapten Daten finden Sie hier.
Insgesamt bestehen die Daten aus 55.363 Zeilen und 7 Spalten.
Analyse und Ergebnisse
Das Projektnotizbuch finden Sie hier.
Ausgewählte Funktionen sind:
- Quelle (4 Quellen wurden für dieses Projekt ausgewählt)
- Ziel (4 Ziele wurden für dieses Projekt ausgewählt)
- Gesamtstopps
- Durchschnittspreis pro Fluggesellschaft
- Dauer
- Preis (Ziel)
Korrelation der Merkmale:
Experimentieren mit verschiedenen Modellen:
Das endgültig ausgewählte Modell ist das Random-Forest-Regressionsmodell mit:
Metrisch | Punktzahl |
---|
MAE | 61,87 |
MSE | 40409.87 |
RMSE | 201.02 |
Daher ist das endgültige Modell in der Lage, Flugticketpreise innerhalb von etwa ≈ 61,87 $ vorherzusagen.
Das endgültige Modell finden Sie hier.
Präsentation
Die Präsentation finden Sie hier.
Mobile App
Wir haben außerdem eine App für Android entwickelt, die anhand unserer gesammelten Daten die durchschnittlichen geschätzten Preise für eine ausgewählte Route und einen ausgewählten Monat ermittelt.
Nachfolgend wird eine Demo der mobilen App gezeigt:
Autoren
Meshal Alamr
Norah Alkhalifah