航班價格預測
SDAIA Bootcamp 專案 2 - 網頁抓取/線性迴歸。
該項目旨在預測即將到來的航班的機票價格,以幫助客戶選擇最佳旅行時間和飛往所需目的地的最便宜的航班。應用隨機森林迴歸模型根據從 Kayak 抓取的資料來預測航班價格。
目錄
專案提案
專案提案可以在這裡找到。
專案最有價值專家
項目 MVP 可以在這裡找到。
刮痧
可以在此處找到 Kayak Scraper Notebook。
以下是正在運行的刮刀的演示(以 2 倍速度播放):
可以在此處找到抓取的資料。
數據總共由 55,363 行和 7 列組成。
分析與結果
項目筆記本可以在這裡找到。
選定的功能是:
- 來源(本計畫選擇了 4 個來源)
- 目的地(本項目選擇了4個目的地)
- 總停靠站
- 每家航空公司的平均價格
- 期間
- 價格(目標)
特徵相關性:
嘗試不同的模型:
最後選擇的模型是隨機森林迴歸模型:
公制 | 分數 |
---|
MAE | 61.87 |
均方誤差 | 40409.87 |
均方根誤差 | 201.02 |
因此,最終模型能夠預測約 61.87 美元左右的機票價格。
最終模型可以在這裡找到。
推介會
簡報可以在這裡找到。
手機應用程式
我們還在 Android 上開發了一個應用程序,可以根據我們抓取的數據找到選定路線和月份的平均預估價格。
下面顯示了行動應用程式的示範:
作者