prediksi harga penerbangan
Proyek SDAIA Bootcamp 2 - web scraping/regresi linier.
Proyek ini bertujuan untuk memprediksi harga tiket penerbangan mendatang guna membantu pelanggan dalam memilih waktu perjalanan yang optimal dan penerbangan termurah ke tujuan yang diinginkan. Model regresi hutan acak diterapkan untuk memperkirakan harga penerbangan berdasarkan data yang diambil dari Kayak.
Daftar isi
- Usul
- MVP
- Menggores
- Analisis dan Hasil
- Presentasi
- Aplikasi Seluler
- Penulis
Proposal Proyek
Proposal proyek dapat ditemukan di sini.
MVP Proyek
MVP proyek dapat ditemukan di sini.
Menggores
Notebook Kayak Scraper dapat ditemukan di sini.
Berikut demo aksi scraper (dimainkan dengan kecepatan 2x):
Data yang tergores dapat ditemukan di sini.
Total datanya terdiri dari 55.363 baris dan 7 kolom.
Analisis dan Hasil
Buku catatan proyek dapat ditemukan di sini.
Fitur yang dipilih adalah:
- Sumber (4 Sumber dipilih untuk proyek ini)
- Tujuan (4 Tujuan dipilih untuk proyek ini)
- Jumlah Berhenti
- Harga Rata-rata per Maskapai Penerbangan
- Lamanya
- Harga (Target)
Korelasi fitur:
Bereksperimen dengan model yang berbeda:
Model terakhir yang dipilih adalah model regresi hutan acak dengan:
Metrik | Skor |
---|
MAE | 61.87 |
UMK | 40409.87 |
RMSE | 201.02 |
Oleh karena itu, model akhir mampu memprediksi harga tiket penerbangan dalam kisaran ≈ $61,87.
Model terakhir dapat ditemukan di sini.
Presentasi
Presentasinya dapat dilihat di sini.
Aplikasi Seluler
Kami juga telah mengembangkan aplikasi di Android yang menemukan perkiraan harga rata-rata untuk rute dan bulan yang dipilih berdasarkan data yang kami ambil.
Di bawah ini, demo aplikasi seluler ditampilkan:
Penulis
Meshal Alamr
Norah Alkhalifah