Tesla의 주가는 LSTM(장단기 기억) 모델을 사용하여 몇 달에 걸쳐 예측됩니다. Tesla에 대한 트윗은 예측 정확도를 높이는 데 사용됩니다.
첫째, LSTM 다변량 시계열 예측 모델을 사용하여 몇 달에 걸쳐 주가를 예측합니다. 그런 다음 Tesla에 대한 트윗을 정리하고 TextBlob을 사용하여 일일 평균 감정 점수를 계산합니다. 마지막으로 일일 평균 감정 점수를 LSTM 모델에 특성으로 추가하여 예측에 사용합니다.
면책조항: 주식 시장은 예측이 매우 어렵기 때문에 LSTM 모델을 사용하여 실생활에서 주가를 예측할 수 없습니다. 이 프로젝트에서는 검증 단계를 사용하여 모델 성능을 테스트합니다. 이 프로젝트의 목적은 LSTM을 사용하여 다변량 시계열 예측을 구현하는 것입니다.
과제는 Tesla에 대한 트윗이 주가에 미치는 영향을 조사하는 것입니다.
csvs zip 파일과 모델 상태는 데이터 폴더에서 액세스할 수 있습니다.
응답 으로는 조정 종가가 사용되며, 그 특징은 다음과 같습니다.
LSTM 모델은 데이터 규모에 민감하고 텐서로 변환되므로 기능이 정규화 됩니다 .
LSTM 모델 매개변수:
input_size=5
batch_first=True
num_classes=1
optimizer=Adam
loss_function=MSELoss()
그리드 검색 알고리즘을 사용하여 Ray Tune 으로 튜닝한 후의 LSTM 모델 하이퍼파라미터 :
hidden_size=3
num_layers=1
learning_rate=0.001
num_epochs=8000
GPU가 활용됩니다.
MSE(평균 제곱 오차) 결과:
트윗은 다음과 같은 방법으로 정리 되고 사전 처리됩니다 .
그런 다음 단어를 표제어로 정리 하고 단어에 대한 빈도 분석을 수행합니다.
트윗의 감정 점수는 TextBlob을 사용하여 계산됩니다. 극성 범위는 [-1.0, 1.0]이며 -1.0은 가장 부정적인 극성, 1.0은 가장 긍정적인 극성, 0.0은 중립 극성입니다. 그런 다음 감정 점수에 대한 빈도 분석이 수행됩니다. 마지막으로 일일 평균 감정 점수가 계산됩니다.
마지막으로 일일 평균 감정 점수가 LSTM 모델에 기능으로 추가되었습니다.
LSTM 모델 매개변수:
input_size=6
num_classes=1
optimizer=Adam
loss_function=MSELoss()
그리드 검색 알고리즘을 사용하여 Ray Tune 으로 튜닝한 후의 LSTM 모델 하이퍼파라미터 :
hidden_size=5
num_layers=1
learning_rate=0.002
num_epochs=8000
GPU가 활용됩니다.
MSE(평균 제곱 오차) 결과:
감정 점수가 없는 예측과 감정 점수가 있는 예측의 MSE 결과에서 트윗의 일일 평균 감정 점수를 LSTM 모델에 기능으로 추가하면 예측 정확도가 향상된다는 것이 분명합니다. 이는 Tesla에 대한 트윗이 주가에 어느 정도 영향을 미친다는 것을 의미합니다.