O preço das ações da Tesla é previsto para alguns meses usando um modelo LSTM (Long Short-Term Memory). Tweets sobre Tesla são usados para melhorar a precisão das previsões.
Primeiro, o preço das ações é previsto ao longo de alguns meses usando um modelo LSTM Multivariate Time-Series Prediction . Em seguida, os tweets sobre Tesla são limpos e suas pontuações médias diárias de sentimento são calculadas usando TextBlob. Por último, as pontuações médias diárias de sentimento são adicionadas como um recurso no modelo LSTM e usadas para previsão.
Isenção de responsabilidade: o modelo LSTM não pode ser usado para prever os preços das ações na vida real porque o mercado de ações é altamente imprevisível. Neste projeto, a fase de validação é utilizada para testar o desempenho do modelo. O objetivo do projeto é implementar a Predição Multivariada de Séries Temporais usando LSTM.
A tarefa é investigar o impacto dos tweets sobre a Tesla no preço de suas ações.
O arquivo zip csvs e os estados do modelo podem ser acessados na pasta de dados .
O preço de fechamento ajustado é usado como resposta e os seguintes são usados como recursos:
Os recursos são normalizados porque um modelo LSTM é sensível à escala dos dados e depois convertidos em tensores.
Parâmetros do modelo LSTM:
input_size=5
batch_first=True
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Hiperparâmetros do modelo LSTM após ajuste com Ray Tune usando algoritmo de pesquisa de grade:
hidden_size=3
num_layers=1
learning_rate=0.001
num_epochs=8000
GPU é aproveitada.
Resultados MSE (erro quadrático médio) :
Os tweets são limpos e pré-processados das seguintes maneiras:
Eles são então lematizados e uma análise de frequência das palavras é realizada.
As pontuações de sentimento para os tweets são calculadas usando TextBlob. A faixa de polaridade é [-1,0, 1,0], com -1,0 como a polaridade mais negativa, 1,0 como a polaridade mais positiva e 0,0 como a polaridade neutra. Em seguida, é realizada uma análise de frequência nas pontuações de sentimento. Por último, as pontuações médias diárias de sentimento são calculadas.
Finalmente, as pontuações médias diárias de sentimento são adicionadas como um recurso ao nosso modelo LSTM.
Parâmetros do modelo LSTM:
input_size=6
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Hiperparâmetros do modelo LSTM após ajuste com Ray Tune usando algoritmo de pesquisa de grade:
hidden_size=5
num_layers=1
learning_rate=0.002
num_epochs=8000
GPU é aproveitada.
Resultados MSE (erro quadrático médio) :
A partir dos resultados do MSE de previsão sem e com pontuações de sentimento, fica claro que adicionar as pontuações médias diárias de sentimento dos tweets como um recurso ao modelo LSTM melhora sua precisão de previsão. Isso significa que os tweets sobre a Tesla têm um certo impacto no preço de suas ações.