Этот репозиторий содержит код для прогнозирования цены на золото с использованием различных методов прогнозирования временных рядов. Используемый набор данных представляет собой ежедневную цену золота в долларах США с 1950-01 по 2020-07 годы.
Набор данных «Месячная цена на золото», использованный для этого анализа, представляет собой ежедневную цену золота в долларах США с 1950-01 по 2020-07 годы. Набор данных содержит 847 наблюдений с двумя столбцами — Дата и Цена.
Блокнот Jupyter Gold_Price_Forecasting_Models.ipynb
содержит код для построения и оценки трех различных моделей прогнозирования временных рядов:
Модель линейной регрессии
Наивная модель
Модель экспоненциального сглаживания
Для модели линейной регрессии набор данных был разделен на обучающий и проверочный наборы. Модель линейной регрессии была адаптирована к обучающим данным и использовалась для прогнозирования цен на золото для тестовых данных. Средняя абсолютная процентная ошибка (MAPE) использовалась для оценки эффективности модели.
В наивной модели последнее значение обучающего набора использовалось для прогнозирования цен на золото на основе тестовых данных. MAPE снова использовался для оценки производительности модели.
Для модели экспоненциального сглаживания использовался пакет statsmodels, чтобы подогнать модель экспоненциального сглаживания ко всему набору данных. Затем модель использовалась для прогнозирования цен на золото на основе тестовых данных. Также были рассчитаны 95% доверительные интервалы для прогнозов. MAPE снова использовался для оценки производительности модели.
Результаты трех моделей сравнивались на основе их баллов MAPE. Модель экспоненциального сглаживания показала лучшие результаты с показателем MAPE 17,235%.
Модель экспоненциального сглаживания использовалась для прогнозирования цен на золото на период с 2020-08 по 2025-2002 годы. Прогнозируемые цены хранятся в CSV-файле с именем gold_price_predictions.csv
.
Набор данных Kaggle: ежемесячная цена на золото
Репозиторий на Гитхабе — ЗДЕСЬ
Проект Kaggle — ЗДЕСЬ
Визуализация временных рядов в таблице
Подробное объяснение кода на MEDIUM