이 프로젝트는 대학원 모듈 내에 Applied Statistics라는 요구 사항 중 하나였습니다. 이 프로젝트의 주요 목표는 기능을 기반으로 항공사 티켓 가격을 예측할 때 정확한 모델을 생성하는 것입니다. 이 프로젝트에 사용 된 기계 학습 모델은 간단한 선형 회귀 및 다중 선형 회귀입니다. 또한, Auto Arima를 사용하는 시대는 2023 년에 특정 항공사의 가격을 예측하기 위해 수행됩니다.이 프로젝트의 주요 프로세스 흐름은 탐색 적 데이터 분석, 데이터 사전 처리, 상관 분석, 모델 교육, 시간 서리 분석을 수행하는 것입니다. 및 ADF를 사용한 가설 테스트.
이 프로젝트는 R 스튜디오 IDE를 사용하여 R 언어로 코딩됩니다.
이 프로젝트에는 "데이터 세트"폴더에있는 2 개의 데이터 세트가 있습니다.
전체 코드는 "Code.r"파일에서 볼 수 있습니다.
누구나 코드의 일부를 사용하려는 경우. 참조하십시오. 감사해요.
이 도메인 내의 현재 연구는 항공권 가격이 가격을 추론하는 데 유용한 회사 및 관광객이 될 수있는 특정 기능 세트를 사용하여 항공권 가격을 예측할 수 있음을 암시합니다. 계절 가격이 때때로 적용되므로 비행 티켓의 가격이 변동하기 때문에 정확한 예측을 얻기가 어렵습니다. 따라서 주요 질문은 이제 비행 시간, 정지 수 등과 같은 비행 자체와 관련된 기능을 기반으로 티켓 가격을 예측할 수 있다는 것입니다.
상관 관계 분석 중에, 티켓을 구매하기 위해 남은 평균 가격과 남은 날 사이에 0.92의 강한 양의 상관 관계가 확인됩니다. 이것은 설립 된 모든 상관 관계 중에서 가장 강력했습니다. 선형 회귀 분석은 "평균 가격"과 "Days_left"기능이 "평균 가격"의 변화의 62.53%를 설명 할 수 있음을 발견했습니다. 또한 The Timeseries 분석에 따르면 2023 년 4 월 Jet Airways의 티켓 가격은 ₹ 12431.34라고 예측했습니다.
전반적 으로이 프로젝트의 결과는이 기능이 항공권 가격을 예측하는 데 사용될 수 있다고 결론지었습니다. 그럼에도 불구하고 날씨 조건과 같은 더 많은 기능을 고려하거나 수치 변수로 데이터 세트를 더 확장하여보다 정확한 결과를 예측할 수 있습니다.
이 프로젝트는 데이터 사전 프로세싱에서 선형 회귀 모델 개발에 이르기까지 모든 프로세스를 다룹니다. 이 프로젝트에서 발견 된 결과는 앞에서 언급 한 모든 통계적 질문을 포함합니다. 데이터 사전 프로세싱을 수행하여 선형 회귀 모델에 데이터를 적합한 표준으로 변환했습니다. 선형 회귀 분석에 유리한 서로에 크게 의존하는 변수를 식별하기 위해 상관 관계 분석이 완료됩니다. 상관 관계 분석을 기반으로 항공 비행 가격표에 대한 예측을 수행하기 위해 선형 회귀 모델이 만들어졌습니다. 또한, 시대의 분석은 2023 년 ₹ 12431.34 인 Jet Airways Airline 티켓의 가격을 예측하기 위해 이루어집니다. 마지막으로, ADF (Augmented Dickey Fuller) 또는 단위 루트 테스트를 사용한 가설 테스트는 타임 서리가 고정인지 아닌지를 식별하기 위해 수행됩니다.
전반적으로 제공된 기능은 항공사 가격표를 추론 할 수 있습니다. 그러나 모든 기능이 사용되는 것은 아니며이 작업을 달성하기에 충분히 강력합니다. 따라서, 날씨 조건과 같은 더 많은 요소를 고려하거나보다 정확한 결과를 예측하는 데 사용할 수있는 더 많은 수치 변수로 더 많은 요인을 고려할 수있는 미래의 개선이 이루어질 수 있습니다.