predicción-precio-vuelo
Proyecto 2 de SDAIA Bootcamp: web scraping/regresión lineal.
Este proyecto tiene como objetivo predecir los precios de los billetes para los próximos vuelos para ayudar a los clientes a seleccionar el momento óptimo para viajar y el vuelo más barato al destino deseado. Se aplica un modelo de regresión forestal aleatoria para pronosticar los precios de los vuelos basándose en datos extraídos de Kayak.
Tabla de contenido
- Propuesta
- MVP
- Raspado
- Análisis y Resultados
- Presentación
- Aplicación móvil
- Autores
Propuesta de proyecto
La propuesta del proyecto se puede encontrar aquí.
MVP del proyecto
El MVP del proyecto se puede encontrar aquí.
Raspado
El cuaderno Kayak Scraper se puede encontrar aquí.
Aquí hay una demostración del raspador en acción (jugado a velocidad 2x):
Los datos extraídos se pueden encontrar aquí.
En total, los datos constan de 55.363 filas y 7 columnas.
Análisis y Resultados
El cuaderno del proyecto se puede encontrar aquí.
Las características seleccionadas son:
- Fuente (Se seleccionaron 4 fuentes para este proyecto)
- Destino (Se seleccionaron 4 destinos para este proyecto)
- Paradas totales
- Precio promedio por aerolínea
- Duración
- Precio (objetivo)
Correlación de características:
Experimentando con diferentes modelos:
El modelo final seleccionado es el modelo de regresión forestal aleatoria con:
Métrico | Puntaje |
---|
MAE | 61,87 |
MSE | 40409.87 |
RMSE | 201.02 |
Por lo tanto, el modelo final es capaz de predecir los precios de los billetes de avión en alrededor de ≈ 61,87 dólares.
El modelo final se puede encontrar aquí.
Presentación
La presentación se puede encontrar aquí.
Aplicación móvil
También hemos desarrollado una aplicación en Android que encuentra los precios promedio estimados para una ruta y un mes seleccionados en función de nuestros datos recopilados.
A continuación se muestra una demostración de la aplicación móvil:
Autores
Meshal Alamr
Norah Alkhalifah