Der Aktienkurs von Tesla wird über mehrere Monate mithilfe eines LSTM-Modells (Long Short-Term Memory) vorhergesagt. Tweets über Tesla werden verwendet, um die Vorhersagegenauigkeit zu verbessern.
Zunächst wird der Aktienkurs über mehrere Monate hinweg mithilfe eines LSTM-Modells zur multivariaten Zeitreihenvorhersage vorhergesagt. Anschließend werden Tweets über Tesla bereinigt und ihre täglichen durchschnittlichen Stimmungswerte mithilfe von TextBlob berechnet. Schließlich werden die täglichen durchschnittlichen Stimmungswerte als Funktion in das LSTM-Modell eingefügt und für die Vorhersage verwendet.
Haftungsausschluss: Das LSTM-Modell kann nicht zur Vorhersage von Aktienkursen im wirklichen Leben verwendet werden, da der Aktienmarkt höchst unvorhersehbar ist. In diesem Projekt dient die Validierungsphase dazu, die Leistung des Modells zu testen. Der Zweck des Projekts besteht darin, die multivariate Zeitreihenvorhersage mithilfe von LSTM zu implementieren.
Die Aufgabe besteht darin, die Auswirkungen von Tweets über Tesla auf den Aktienkurs zu untersuchen.
Auf die CSV-ZIP-Datei und die Modellstatus kann über den Datenordner zugegriffen werden.
Als Antwort wird der Adj-Schlusspreis und als Merkmale Folgendes verwendet:
Die Merkmale werden normalisiert , da ein LSTM-Modell empfindlich auf den Datenumfang reagiert, und dann in Tensoren umgewandelt.
Parameter des LSTM-Modells:
input_size=5
batch_first=True
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Hyperparameter des LSTM-Modells nach der Abstimmung mit Ray Tune unter Verwendung des Grid Search-Algorithmus:
hidden_size=3
num_layers=1
learning_rate=0.001
num_epochs=8000
GPU wird ausgenutzt.
MSE-Ergebnisse (mittlerer quadratischer Fehler) :
Die Tweets werden auf folgende Weise bereinigt und vorverarbeitet :
Anschließend werden sie lemmatisiert und eine Häufigkeitsanalyse der Wörter durchgeführt.
Die Sentiment-Scores für die Tweets werden mithilfe von TextBlob berechnet. Der Polaritätsbereich ist [-1,0, 1,0], wobei -1,0 die negativste Polarität, 1,0 die positivste Polarität und 0,0 die neutrale Polarität darstellt. Anschließend wird eine Häufigkeitsanalyse der Stimmungswerte durchgeführt. Abschließend werden die täglichen durchschnittlichen Stimmungswerte berechnet.
Schließlich werden die täglichen durchschnittlichen Stimmungswerte als Funktion zu unserem LSTM-Modell hinzugefügt.
Parameter des LSTM-Modells:
input_size=6
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Hyperparameter des LSTM-Modells nach der Abstimmung mit Ray Tune unter Verwendung des Grid Search-Algorithmus:
hidden_size=5
num_layers=1
learning_rate=0.002
num_epochs=8000
GPU wird ausgenutzt.
MSE-Ergebnisse (mittlerer quadratischer Fehler) :
Aus den MSE-Ergebnissen der Vorhersage ohne und mit Sentiment-Scores geht klar hervor, dass das Hinzufügen der täglichen durchschnittlichen Sentiment-Scores von Tweets als Funktion zum LSTM-Modell dessen Vorhersagegenauigkeit verbessert. Das bedeutet, dass Tweets über Tesla einen gewissen Einfluss auf den Aktienkurs haben.