Este projeto foi um dos requisitos do meu módulo de pós -graduação chamado estatísticas aplicadas. O principal objetivo deste projeto é gerar um modelo preciso na previsão do preço do ingresso aéreo com base nos recursos. Os modelos de aprendizado de máquina usados neste projeto são regressão linear simples e regressão linear múltipla. Além disso, uma série de tempo usando o Auto ARIMA é realizada para prever o preço de uma companhia aérea específica no ano de 2023. O principal fluxo de processo deste projeto é executar a análise de dados exploratórios, pré-processamento de dados, análise de correa, treinamento de modelos, análise de times, análise, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de times, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de tempo, análise de times, análise de times, análise de times, análise de times, e teste de hipótese usando ADF.
O projeto é codificado no idioma R usando o R Studio IDE.
Existem 2 conjuntos de dados usados neste projeto, localizados na pasta "DataSet".
O código completo pode ser visualizado no arquivo "code.r".
Se alguém quiser usar uma parte do código. Por favor, faça referência. Obrigado.
A pesquisa atual nesse domínio implicam que os preços das ingressos para a companhia aérea podem ser previstos usando um conjunto de determinados recursos que podem ser empresas e turistas úteis para deduzir o preço e quando é o melhor momento para comprar uma passagem de voo. Como o preço de uma passagem de voo flutua, pois há um preço sazonal aplicado de tempos em tempos, é difícil obter uma previsão precisa. Assim, a principal questão agora é possível prever o preço do ingresso com base em recursos relacionados ao próprio voo, como duração do voo, número de paradas, etc.
Durante a análise de correlação, uma forte correlação positiva de 0,92 é identificada entre o preço médio e os dias restantes restantes para comprar o bilhete. Esta foi a mais forte de toda correlação fundada. A análise de regressão linear descobriu que o recurso "Preço médio" e "Days_Left" poderiam explicar 62,53% da variação do "preço médio". Além disso, a análise do tempo prevista que, em abril de 2023, o preço do ingresso para a Jet Airways é de ₹ 12431,34.
No geral, as descobertas neste projeto concluem que os recursos podem ser usados para prever o preço do ingresso aéreo. No entanto, mais recursos podem ser considerados, como condição climática ou expandir o conjunto de dados mais com variáveis numéricas para prever um resultado mais preciso.
O projeto abrange todo o processo, desde os dados pré-processamento até o desenvolvimento de um modelo de regressão linear. Os resultados encontrados neste projeto abrangem todas as perguntas estatísticas mencionadas anteriormente. O pré-processamento de dados foi realizado para transformar os dados em padrão adequado para o modelo de regressão linear. Uma análise de correlação é concluída para identificar quais são as variáveis que são fortemente dependentes uma da outra, que são benéficas para a análise de regressão linear. Com base na análise de correlação, o modelo de regressão linear foi criado para realizar previsão no bilhete de preços de voo da companhia aérea. Além disso, é feita uma análise do TimeSeries para prever o preço do ingresso da Jet Airways Airline em 2023, que é de ₹ 12431,34. Finalmente, o teste de hipóteses usando o teste de Dickey Fuller (ADF) ou o teste de raiz unitário é realizado para identificar se o TimeSeries está estacionário ou não.
No geral, os recursos fornecidos podem deduzir o bilhete de preço da companhia aérea. No entanto, nem todos os recursos são usados e fortes o suficiente para realizar essa tarefa. Assim, uma melhoria futura pode ser feita quando mais fatores podem ser considerados, como condição climática ou expandir o conjunto de dados mais com mais variáveis numéricas que podem ser usadas para prever um resultado mais preciso.