항공편 가격 예측
SDAIA 부트캠프 프로젝트 2 - 웹 스크래핑/선형 회귀.
이 프로젝트는 고객이 최적의 여행 시간과 원하는 목적지까지 가장 저렴한 항공편을 선택할 수 있도록 향후 항공편의 티켓 가격을 예측하는 것을 목표로 합니다. Kayak에서 수집한 데이터를 기반으로 항공편 가격을 예측하기 위해 Random Forest 회귀 모델이 적용되었습니다.
목차
- 제안
- MVP
- 긁기
- 분석 및 결과
- 프레젠테이션
- 모바일 앱
- 저자
프로젝트 제안
프로젝트 제안서는 여기에서 확인할 수 있습니다.
프로젝트 MVP
프로젝트 MVP는 여기에서 찾을 수 있습니다.
긁기
Kayak Scraper Notebook은 여기에서 찾을 수 있습니다.
다음은 스크레이퍼 작동 데모입니다(2배속 재생).
스크랩된 데이터는 여기에서 확인하실 수 있습니다.
전체 데이터는 55,363개의 행과 7개의 열로 구성됩니다.
분석 및 결과
프로젝트 노트북은 여기에서 찾을 수 있습니다.
선택된 기능은 다음과 같습니다:
- 소스 (이 프로젝트에는 4개의 소스가 선택되었습니다)
- 목적지(이 프로젝트에서는 4개의 목적지가 선택되었습니다)
- 총 정류장
- 항공사당 평균 가격
- 지속
- 가격(목표)
기능의 상관관계:
다양한 모델 실험:
최종 선택된 모델은 다음을 갖춘 Random Forest 회귀 모델입니다.
미터법 | 점수 |
---|
매 | 61.87 |
MSE | 40409.87 |
RMSE | 201.02 |
따라서 최종 모델은 약 $61.87 내에서 항공권 가격을 예측할 수 있습니다.
최종 모델은 여기에서 찾을 수 있습니다.
프레젠테이션
프레젠테이션은 여기에서 확인할 수 있습니다.
모바일 앱
우리는 또한 스크랩한 데이터를 기반으로 선택한 경로와 월에 대한 평균 예상 가격을 찾는 Android 앱을 개발했습니다.
아래에는 모바일 앱의 데모가 나와 있습니다.
저자