Этот проект был одним из требований в моем аспирантуре под названием Applied Statistics. Основная цель этого проекта - генерировать точную модель в прогнозировании цены билета на авиакомпании на основе функций. Модели машинного обучения, используемые в этом проекте, представляют собой простую линейную регрессию и множественную линейную регрессию. Кроме того, время с использованием AUTO ARIMA выполняется для прогнозирования цены на определенную авиакомпанию в 2023 году. Основным процессом этого проекта является анализ исследовательского анализа, предварительная обработка данных, анализ корревации, модельная подготовка, анализ времени времени, анализ времени, серия, анализ времени, серия,, анализ времени, серий,, анализ времени,, анализ времени,, анализ времени,, анализ времени, серийный анализ, серию, анализ времени, серийный анализ, серию. и гипотеза тестирование с использованием ADF.
Проект кодируется на языке R с использованием R Studio IDE.
В этом проекте используется 2 набора данных, которые расположены в папке «Набор данных».
Полный код можно просматривать в файле "code.r".
Если кто -то хочет использовать часть кода. Пожалуйста, ссылайтесь на это. Спасибо.
Текущее исследование в этом домене подразумевает, что цены на авиабилеты могут быть предсказаны с использованием набора определенных функций, которые могут быть полезными компаниями и туристом, чтобы вывести цену и когда лучше всего купить билет полета. Поскольку цена летного билета колеблется, поскольку время от времени применяется сезонная цена, трудно получить точный прогноз. Таким образом, главный вопрос в настоящее время заключается в том, что можно предсказать цену билета на основе функций, связанных с самим рейсом, таких как продолжительность полета, количество остановок и т. Д.
Во время анализа корреляции сильная положительная корреляция 0,92 выявлена между средней ценой и оставшимися оставшимися днями, чтобы купить билет. Это была самая сильная из всех основанных корреляций. Анализ линейной регрессии обнаружил, что функция «средняя цена» и «days_left» может объяснить 62,53% от изменения «средней цены». Более того, анализ Timesseries прогнозировал, что в апреле 2023 года цена билета на Jet Airways составляет 12431,34 фунтов стерлингов.
В целом, результаты в этом проекте приходят к выводу, что функции могут быть использованы для прогнозирования цены билета авиакомпании. Тем не менее, можно считать больше функций, таких как погодные условия или расширение набора данных с помощью численных переменных, чтобы предсказать более точный результат.
Проект охватывает весь процесс от предварительной обработки данных до разработки модели линейной регрессии. Результаты, найденные в этом проекте, включают все статистические вопросы, упомянутые ранее. Предварительная обработка данных была выполнена для преобразования данных в подходящий стандарт для модели линейной регрессии. Анализ корреляции завершен для определения того, какие переменные, которые сильно зависят друг от друга, которые полезны для анализа линейной регрессии. Основываясь на анализе корреляции, была создана линейная регрессионная модель для выполнения прогнозирования по билету на рейс авиакомпании. Кроме того, проводится анализ времени для прогнозирования цены билета авиакомпании Jet Airways в 2023 году, которая составляет 12431,34 фунтов стерлингов. Наконец, тестирование гипотез с использованием дополненного дикки Фуллера (ADF) или единичного корневого теста проводится для определения того, является ли временные интернет -синдштейн.
В целом, предоставленные функции могут вывести билет на авиакомпанию. Однако не все функции используются и достаточно сильны для выполнения этой задачи. Таким образом, будущее улучшение может быть сделано, когда можно рассматривать больше факторов, таких как погодные условия или расширение набора данных большим количеством с большим количеством численных переменных, которые можно использовать для прогнозирования более точного результата.