previsão de preço de voo
Projeto SDAIA Bootcamp 2 - web scraping/regressão linear.
Este projeto tem como objetivo prever os preços dos bilhetes para os próximos voos para ajudar os clientes a selecionar o melhor momento para viajar e o voo mais barato para o destino desejado. Um modelo de regressão florestal aleatório é aplicado para prever os preços dos voos com base nos dados extraídos do Kayak.
Índice
- Proposta
- MVP
- Raspagem
- Análise e Resultados
- Apresentação
- Aplicativo móvel
- Autores
Proposta de Projeto
A proposta do projeto pode ser consultada aqui.
MVP do projeto
O MVP do projeto pode ser encontrado aqui.
Raspagem
O Caderno Raspador Kayak pode ser encontrado aqui.
Aqui está uma demonstração do raspador em ação (jogado em velocidade 2x):
Os dados extraídos podem ser encontrados aqui.
No total, os dados consistem em 55.363 linhas e 7 colunas.
Análise e Resultados
O caderno do projeto pode ser encontrado aqui.
Os recursos selecionados são:
- Fonte (4 fontes foram selecionadas para este projeto)
- Destino (4 destinos foram selecionados para este projeto)
- Total de paradas
- Preço médio por companhia aérea
- Duração
- Preço (alvo)
Correlação de recursos:
Experimentando diferentes modelos:
O modelo final selecionado é o modelo de regressão florestal aleatória com:
Métrica | Pontuação |
---|
MAE | 61,87 |
MSE | 40409,87 |
REQM | 201.02 |
Portanto, o modelo final é capaz de prever preços de passagens aéreas em torno de ≈ $ 61,87.
O modelo final pode ser encontrado aqui.
Apresentação
A apresentação pode ser encontrada aqui.
Aplicativo móvel
Também desenvolvemos um aplicativo para Android que encontra os preços médios estimados para uma rota e mês selecionados com base em nossos dados coletados.
Abaixo, uma demonstração do aplicativo móvel é mostrada:
Autores
Meshal Alamr
Norah Alkhalifah