Цена акций Tesla прогнозируется на несколько месяцев с использованием модели LSTM (Long Short-Term Memory). Твиты о Tesla используются для повышения точности прогнозов.
Во-первых, цена акций прогнозируется на несколько месяцев с использованием модели многомерного прогнозирования временных рядов LSTM . Затем твиты о Tesla очищаются, и их среднедневные оценки настроений рассчитываются с помощью TextBlob. Наконец, среднедневные оценки настроений добавляются в качестве функции в модель LSTM и используются для прогнозирования.
Отказ от ответственности: модель LSTM нельзя использовать для прогнозирования цен на акции в реальной жизни, поскольку фондовый рынок крайне непредсказуем. В этом проекте этап проверки используется для проверки производительности модели. Целью проекта является реализация многомерного прогнозирования временных рядов с использованием LSTM.
Задача — исследовать влияние твитов о Tesla на цену ее акций.
Доступ к ZIP-файлу csvs и состояниям модели можно получить из папки данных .
В качестве ответа используется скорректированная цена закрытия , а в качестве функций используются следующие параметры:
Функции нормализуются , поскольку модель LSTM чувствительна к масштабу данных, а затем преобразуются в тензоры.
Параметры модели LSTM:
input_size=5
batch_first=True
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Гиперпараметры модели LSTM после настройки с помощью Ray Tune с использованием алгоритма поиска по сетке:
hidden_size=3
num_layers=1
learning_rate=0.001
num_epochs=8000
Используется графический процессор .
Результаты MSE (среднеквадратическая ошибка) :
Твиты очищаются и предварительно обрабатываются следующими способами:
Затем они лемматизируются и проводится частотный анализ слов.
Оценки тональности твитов рассчитываются с помощью TextBlob. Диапазон полярности составляет [-1,0, 1,0], где -1,0 — самая отрицательная полярность, 1,0 — самая положительная полярность и 0,0 — нейтральная полярность. Затем проводится частотный анализ оценок настроений. Наконец, рассчитываются средние дневные оценки настроений .
Наконец, в нашу модель LSTM добавляются средние дневные оценки настроений.
Параметры модели LSTM:
input_size=6
num_classes=1
optimizer=Adam
loss_function=MSELoss()
Гиперпараметры модели LSTM после настройки с помощью Ray Tune с использованием алгоритма поиска по сетке:
hidden_size=5
num_layers=1
learning_rate=0.002
num_epochs=8000
Используется графический процессор .
Результаты MSE (среднеквадратическая ошибка) :
Из результатов MSE прогнозирования без и с оценками настроений становится ясно, что добавление среднесуточных оценок настроений твитов в качестве функции в модель LSTM повышает точность ее прогнозирования. Это означает, что твиты о Tesla оказывают определенное влияние на цену ее акций.