Le cours de l'action Tesla est prédit sur quelques mois à l'aide d'un modèle LSTM (Long Short-Term Memory). Les tweets sur Tesla sont utilisés pour améliorer la précision des prédictions.
Premièrement, le cours de l’action est prédit sur quelques mois à l’aide d’un modèle de prédiction de séries chronologiques multivariées LSTM . Ensuite, les tweets sur Tesla sont nettoyés et leurs scores de sentiment moyens quotidiens sont calculés à l'aide de TextBlob. Enfin, les scores de sentiment moyens quotidiens sont ajoutés en tant que fonctionnalité dans le modèle LSTM et utilisés à des fins de prédiction.
Avertissement : Le modèle LSTM ne peut pas être utilisé pour prédire les cours boursiers dans la vie réelle car le marché boursier est très imprévisible. Dans ce projet, la phase de validation permet de tester les performances du modèle. Le but du projet est de mettre en œuvre la prédiction de séries chronologiques multivariées à l'aide du LSTM.
La tâche consiste à étudier l’impact des tweets sur Tesla sur le cours de ses actions.
Le fichier zip csvs et les états du modèle sont accessibles à partir du dossier de données .
Le prix de clôture ajusté est utilisé comme réponse et les éléments suivants sont utilisés comme caractéristiques :
Les caractéristiques sont normalisées car un modèle LSTM est sensible à l'échelle des données, puis converties en tenseurs.
Paramètres du modèle LSTM :
input_size=5
batch_first=True
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Hyperparamètres du modèle LSTM après réglage avec Ray Tune à l'aide de l'algorithme de recherche de grille :
hidden_size=3
num_layers=1
learning_rate=0.001
num_epochs=8000
Le GPU est exploité.
Résultats MSE (erreur quadratique moyenne) :
Les tweets sont nettoyés et prétraités des manières suivantes :
Ils sont ensuite lemmatisés , et une analyse fréquentielle est réalisée sur les mots.
Les scores de sentiment pour les tweets sont calculés à l'aide de TextBlob. La plage de polarité est [-1,0, 1,0], avec -1,0 comme polarité la plus négative, 1,0 comme polarité la plus positive et 0,0 comme polarité neutre. Ensuite, une analyse de fréquence est effectuée sur les scores de sentiment. Enfin, les scores de sentiment moyens quotidiens sont calculés.
Enfin, les scores de sentiment moyens quotidiens sont ajoutés en tant que fonctionnalité à notre modèle LSTM.
Paramètres du modèle LSTM :
input_size=6
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Hyperparamètres du modèle LSTM après réglage avec Ray Tune à l'aide de l'algorithme de recherche de grille :
hidden_size=5
num_layers=1
learning_rate=0.002
num_epochs=8000
Le GPU est exploité.
Résultats MSE (erreur quadratique moyenne) :
D'après les résultats MSE de la prédiction sans et avec les scores de sentiment, il est clair que l'ajout des scores de sentiment moyens quotidiens des tweets en tant que fonctionnalité au modèle LSTM améliore la précision de sa prédiction. Cela signifie que les tweets sur Tesla ont un certain impact sur le cours de ses actions.