テスラの株価は、LSTM (Long Short-Term Memory) モデルを使用して数か月にわたって予測されます。テスラに関するツイートは、予測精度を向上させるために使用されます。
まず、 LSTM 多変量時系列予測モデルを使用して、株価が数か月にわたって予測されます。次に、テスラに関するツイートがクリーンアップされ、 TextBlob を使用してその日の平均センチメント スコアが計算されます。最後に、日次平均センチメント スコアが LSTM モデルの特徴として追加され、予測に使用されます。
免責事項:株式市場は非常に予測不可能であるため、LSTM モデルを使用して現実の株価を予測することはできません。このプロジェクトでは、検証フェーズを使用してモデルのパフォーマンスをテストします。プロジェクトの目的は、LSTM を使用して多変量時系列予測を実装することです。
任務は、テスラに関するツイートが株価に与える影響を調査することだ。
csvs zip ファイルとモデルの状態には、データフォルダーからアクセスできます。
調整終値が応答として使用され、以下が特徴として使用されます。
LSTM モデルはデータのスケールに影響されるため、特徴は正規化されてからテンソルに変換されます。
LSTM モデルのパラメーター:
input_size=5
batch_first=True
num_classes=1
optimizer=Adam
loss_function=MSELoss()
グリッド検索アルゴリズムを使用してRay Tuneで調整した後の LSTM モデルのハイパーパラメーター:
hidden_size=3
num_layers=1
learning_rate=0.001
num_epochs=8000
GPUが活用されています。
MSE (平均二乗誤差) の結果:
ツイートは次の方法でクリーンアップおよび前処理されます。
次に、それらは見出し語化され、単語の頻度分析が実行されます。
ツイートの感情スコアはTextBlob を使用して計算されます。極性範囲は [-1.0, 1.0] で、-1.0 が最も負の極性、1.0 が最も正の極性、0.0 が中立極性です。次に、感情スコアに対して頻度分析が実行されます。最後に、毎日の平均感情スコアが計算されます。
最後に、日次平均感情スコアが LSTM モデルに特徴として追加されます。
LSTM モデルのパラメーター:
input_size=6
num_classes=1
optimizer=Adam
loss_function=MSELoss()
グリッド検索アルゴリズムを使用してRay Tuneで調整した後の LSTM モデルのハイパーパラメーター:
hidden_size=5
num_layers=1
learning_rate=0.002
num_epochs=8000
GPUが活用されています。
MSE (平均二乗誤差) の結果:
センチメント スコアを使用しない場合と使用する場合の MSE 結果から、ツイートの日次平均センチメント スコアを特徴として LSTM モデルに追加することで予測精度が向上することが明らかです。これは、テスラに関するツイートが株価に一定の影響を与えることを意味します。