Proyek ini adalah salah satu persyaratan dalam modul pascasarjana saya yang disebut Statistik Terapan. Tujuan utama dari proyek ini adalah untuk menghasilkan model yang akurat dalam memprediksi harga tiket pesawat berdasarkan fitur. Model pembelajaran mesin yang digunakan dalam proyek ini adalah regresi linier sederhana dan beberapa regresi linier. Selain itu, waktu yang menggunakan Auto ARIMA dilakukan untuk memperkirakan harga maskapai tertentu pada tahun 2023. Aliran proses utama proyek ini melakukan analisis data eksplorasi, data pra-pemrosesan data, analisis corealtion, pelatihan model, analisis waktu, waktu, waktu, analisis waktu, dan pengujian hipotesis menggunakan ADF.
Proyek ini diberi kode dalam bahasa R menggunakan IDE R Studio.
Ada 2 dataset yang digunakan dalam proyek ini yang terletak di folder "Dataset".
Kode lengkap dapat dilihat di file "code.r".
Jika ada yang ingin menggunakan bagian dari kode. Tolong referensi. Terima kasih.
Penelitian saat ini dalam domain ini menyiratkan bahwa harga tiket pesawat dapat diprediksi menggunakan serangkaian fitur tertentu yang dapat menjadi perusahaan dan wisatawan yang berguna untuk menyimpulkan harga dan kapan waktu terbaik untuk membeli tiket penerbangan. Karena harga tiket penerbangan berfluktuasi karena ada harga musiman diterapkan dari waktu ke waktu, sulit untuk mendapatkan prediksi yang akurat. Dengan demikian, pertanyaan utama sekarang adalah mungkin untuk memprediksi harga tiket berdasarkan fitur yang terkait dengan penerbangan itu sendiri seperti durasi penerbangan, jumlah berhenti, dll.
Selama analisis korelasi, korelasi positif yang kuat sebesar 0,92 diidentifikasi antara harga rata -rata dan sisa hari tersisa untuk membeli tiket. Ini adalah yang terkuat dari semua korelasi yang didirikan. Analisis regresi linier menemukan bahwa fitur "harga rata -rata" dan "days_left" dapat menjelaskan 62,53% dari variasi "harga rata -rata". Selain itu, analisis Timeseries memperkirakan bahwa pada bulan April 2023 harga tiket untuk Jet Airways adalah ₹ 12431,34.
Secara keseluruhan, temuan dalam proyek ini menyimpulkan bahwa fitur dapat digunakan untuk memprediksi harga tiket pesawat. Namun demikian, lebih banyak fitur dapat dipertimbangkan seperti kondisi cuaca atau memperluas dataset lebih banyak dengan variabel numerik untuk memprediksi hasil yang lebih akurat.
Proyek ini mencakup semua proses dari data pra-pemrosesan hingga pengembangan model regresi linier. Hasil yang ditemukan dalam proyek ini mencakup semua pertanyaan statistik yang disebutkan sebelumnya. Pra-pemrosesan data dilakukan untuk mengubah data menjadi standar yang sesuai untuk model regresi linier. Analisis korelasi diselesaikan untuk mengidentifikasi variabel mana yang sangat tergantung satu sama lain yang bermanfaat untuk analisis regresi linier. Berdasarkan analisis korelasi, model regresi linier dibuat untuk melakukan prediksi pada tiket harga penerbangan maskapai. Selain itu, analisis timeseries dibuat untuk memperkirakan harga tiket Jet Airways Airline pada tahun 2023 yaitu ₹ 12431,34. Akhirnya, pengujian hipotesis menggunakan augmented Dickey Fuller (ADF) atau uji unit root dilakukan untuk mengidentifikasi apakah timeseries stasioner atau tidak.
Secara keseluruhan, fitur yang disediakan dapat menyimpulkan tiket harga maskapai. Namun, tidak semua fitur digunakan dan cukup kuat untuk mencapai tugas ini. Dengan demikian, peningkatan di masa depan dapat dilakukan di mana lebih banyak faktor dapat dipertimbangkan seperti kondisi cuaca atau memperluas dataset lebih banyak dengan variabel yang lebih numerik yang dapat digunakan untuk memprediksi hasil yang lebih akurat.