El precio de las acciones de Tesla se predice durante algunos meses utilizando un modelo LSTM (Long Short-Term Memory). Los tweets sobre Tesla se utilizan para mejorar la precisión de las predicciones.
Primero, el precio de las acciones se predice durante algunos meses utilizando un modelo de predicción de series de tiempo multivariado de LSTM . Luego, los tweets sobre Tesla se limpian y sus puntuaciones de sentimiento promedio diarias se calculan utilizando TextBlob. Por último, las puntuaciones de sentimiento promedio diarias se agregan como una característica en el modelo LSTM y se utilizan para la predicción.
Descargo de responsabilidad: el modelo LSTM no se puede utilizar para predecir los precios de las acciones en la vida real porque el mercado de valores es muy impredecible. En este proyecto, la fase de validación se utiliza para probar el rendimiento del modelo. El propósito del proyecto es implementar la predicción multivariada de series de tiempo utilizando LSTM.
La tarea consiste en investigar el impacto de los tweets sobre Tesla en el precio de sus acciones.
Se puede acceder al archivo zip csvs y a los estados del modelo desde la carpeta de datos .
El precio de cierre ajustado se utiliza como respuesta y lo siguiente se utiliza como características:
Las características están normalizadas porque un modelo LSTM es sensible a la escala de los datos y luego se convierte en tensores.
Parámetros del modelo LSTM:
input_size=5
batch_first=True
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Hiperparámetros del modelo LSTM después de ajustar con Ray Tune usando el algoritmo de búsqueda de cuadrícula:
hidden_size=3
num_layers=1
learning_rate=0.001
num_epochs=8000
Se aprovecha la GPU .
Resultados de MSE (error cuadrático medio) :
Los tweets se limpian y preprocesan de las siguientes maneras:
Luego se lematizan y se realiza un análisis de frecuencia de las palabras.
Las puntuaciones de sentimiento de los tweets se calculan utilizando TextBlob. El rango de polaridad es [-1,0, 1,0], siendo -1,0 la polaridad más negativa, 1,0 la polaridad más positiva y 0,0 la polaridad neutra. Luego, se realiza un análisis de frecuencia de las puntuaciones de sentimiento. Por último, se calculan las puntuaciones de sentimiento promedio diarias .
Finalmente, las puntuaciones de sentimiento promedio diarias se agregan como una característica de nuestro modelo LSTM.
Parámetros del modelo LSTM:
input_size=6
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Hiperparámetros del modelo LSTM después de ajustar con Ray Tune usando el algoritmo de búsqueda de cuadrícula:
hidden_size=5
num_layers=1
learning_rate=0.002
num_epochs=8000
Se aprovecha la GPU .
Resultados de MSE (error cuadrático medio) :
A partir de los resultados de MSE de predicción sin y con puntuaciones de sentimiento, está claro que agregar las puntuaciones de sentimiento promedio diarias de los tweets como una característica del modelo LSTM mejora su precisión de predicción. Esto significa que los tweets sobre Tesla tienen un nivel de impacto en el precio de sus acciones.