このリポジトリには、さまざまな時系列予測方法を使用して金の価格を予測するためのコードが含まれています。使用されるデータセットは、1950 年 1 月から 2020 年 7 月までの米ドル建ての金の日次価格です。
この分析に使用される月次金価格データセットは、1950 年 1 月から 2020 年 7 月までの米ドルでの金の日次価格です。データセットには、日付と価格の 2 つの列を持つ 847 個の観測値が含まれています。
Jupyter ノートブックGold_Price_Forecasting_Models.ipynb
には、3 つの異なる時系列予測モデルを構築および評価するためのコードが含まれています。
線形回帰モデル
ナイーブモデル
指数平滑法モデル
線形回帰モデルの場合、データセットはトレーニング セットとテスト セットに分割されました。線形回帰モデルはトレーニング データに当てはめられ、テスト データの金価格を予測するために使用されました。平均絶対パーセント誤差 (MAPE) を使用してモデルのパフォーマンスを評価しました。
単純モデルの場合、テスト データの金価格を予測するためにトレーニング セットの最後の値が使用されました。モデルのパフォーマンスを評価するために、MAPE が再度使用されました。
指数平滑化モデルの場合、statsmodels パッケージを使用して、データセット全体に指数平滑化モデルを適合させました。次に、このモデルを使用して、テスト データの金価格を予測しました。予測の 95% 信頼区間も計算されました。モデルのパフォーマンスを評価するために、MAPE が再度使用されました。
3 つのモデルの結果は、MAPE スコアに基づいて比較されました。指数平滑化モデルは、MAPE スコア 17.235% で最高のパフォーマンスを示しました。
指数平滑法モデルは、2020 年 8 月から 2025 年 2 月までの期間の金価格を予測するために使用されました。予測価格は、 gold_price_predictions.csv
という名前の CSV ファイルに保存されます。
Kaggle データセット: 毎月のゴールド価格
Github リポジトリ - こちら
Kaggle プロジェクト - こちら
Tableau での時系列の視覚化
MEDIUMのコードの詳細説明