chronos forecasting下載 - chronos forecasting原始碼下載

chronos forecasting

其他源碼

1.2.0

下載

Chronos：學習時間序列的語言

訊息

2024 年 6 月 27 日：發布了論文中使用的資料集以及用於計算論文中報告的 WQL 和 MASE 分數的評估腳本。
2024 年 5 月 17 日：？修正了output_transform中 bin 索引的相差一錯誤。這個簡單的修復顯著提高了 Chronos 的整體效能。我們將在 ArXiv 的下一個版本中更新結果。
2024 年 5 月 10 日：我們新增了用於預訓練和微調 Chronos 模型的程式碼。您可以在此資料夾中找到它。我們還添加了一個用於從高斯過程生成合成時間序列數據的腳本（KernelSynth；有關詳細信息，請參閱論文中的第 4.2 節）。查看使用範例。
2024 年 4 月 19 日：Chronos 現已獲得 AutoGluon-TimeSeries 的支持，這是用於時間序列預測的強大 AutoML 軟體包，可實現模型整合、雲端部署等。開始使用教程。
2024 年 4 月 8 日：？添加了實驗性 MLX 推理支持。如果您擁有 Apple Silicon Mac，那麼與 CPU 推理相比，您現在可以從 Chronos 獲得更快的預測速度。這提供了另一種利用 Apple Silicon Mac 上的 GPU 以及 PyTorch 中的「mps」支援的替代方法。
2024 年 3 月 25 日：v1.1.0 發布，包含推理優化和pipeline.embed用於從 Chronos 中提取編碼器嵌入。
2024 年 3 月 13 日：Chronos 論文和推理代碼發布。

介紹

Chronos 是一系列基於語言模型架構的預訓練時間序列預測模型。透過縮放和量化將時間序列轉換為標記序列，並使用交叉熵損失對這些標記進行語言模型的訓練。經過訓練後，可以透過在給定歷史背景下對多個未來軌跡進行採樣來獲得機率預測。 Chronos 模型已經在大量公開的時間序列資料以及使用高斯過程產生的合成資料上進行了訓練。

有關 Chronos 模型、訓練數據和過程以及實驗結果的詳細信息，請參閱論文 Chronos：學習時間序列語言。

圖 1：Chronos 的高階描述。（左）輸入時間序列經過縮放和量化以獲得標記序列。（中）標記被輸入到語言模型中，該模型可以是編碼器-解碼器或僅解碼器模型。該模型使用交叉熵損失進行訓練。（右）在推理過程中，我們從模型中自回歸採樣標記並將它們映射回數值。對多個軌跡進行取樣以獲得預測分佈。

建築學

此儲存庫中的模型基於 T5 架構。唯一的差異在於詞彙量：Chronos-T5 模型使用 4096 個不同的標記，而原始 T5 模型使用 32128 個標記，因此參數較少。

模型	參數	基於
chronos-t5-小	8M	t5-高效-微小
chronos-t5-迷你	20M	t5-高效率-迷你
chronos-t5-小號	46M	t5-高效-小型
chronos-t5-基地	200M	t5-高效基
chronos-t5-大號	710M	t5-高效-大型

零樣本結果

下圖展示了 Chronos 模型在 27 個資料集上相對於本地模型、特定任務模型和其他預訓練模型的卓越零樣本表現。有關評估設定和其他結果的詳細信息，請參閱論文。

圖 2：不同模型在 Benchmark II 上的效能，包括 Chronos 模型在訓練期間未見過的 27 個資料集。此基準測試提供了 Chronos 模型相對於本地統計模型的零樣本性能的見解，本地統計模型分別擬合每個時間序列的參數、針對每個任務訓練的特定於任務的模型以及在大型時間序列語料庫上訓練的預訓練模型。預訓練模型（其他）表示 Benchmark II 中的部分（或全部）資料集可能已在這些模型的訓練語料庫中。使用季節性樸素基線的分數對機率 (WQL) 和點 (MASE) 預測指標進行歸一化，並透過幾何平均值進行聚合以獲得 Agg。分別相對於 WQL 和 MASE。

？用法

若要使用 Chronos 模型執行推理，請透過執行以下命令安裝此軟體包：

 pip install git+https://github.com/amazon-science/chronos-forecasting.git

提示

在生產用例中使用 Chronos 的建議方法是透過 AutoGluon，它具有與其他統計和機器學習模型整合以進行時間序列預測以及透過 SageMaker® 在 AWS 上無縫部署的功能。查看 AutoGluon Chronos 教學。

預測

展示如何使用 Chronos 模型執行預測的最小範例：

 import pandas as pd  # requires: pip install pandas
import torch
from chronos import ChronosPipeline

pipeline = ChronosPipeline . from_pretrained (
    "amazon/chronos-t5-small" ,
    device_map = "cuda" ,  # use "cpu" for CPU inference and "mps" for Apple Silicon
    torch_dtype = torch . bfloat16 ,
)

df = pd . read_csv ( "https://raw.githubusercontent.com/AileenNielsen/TimeSeriesAnalysisWithPython/master/data/AirPassengers.csv" )

# context must be either a 1D tensor, a list of 1D tensors,
# or a left-padded 2D tensor with batch as the first dimension
# forecast shape: [num_series, num_samples, prediction_length]
forecast = pipeline . predict (
    context = torch . tensor ( df [ "#Passengers" ]),
    prediction_length = 12 ,
    num_samples = 20 ,
)

pipeline.predict的更多選項可以透過以下方式找到：

 print ( ChronosPipeline . predict . __doc__ )

我們現在可以視覺化預測：

 import matplotlib . pyplot as plt  # requires: pip install matplotlib
import numpy as np

forecast_index = range ( len ( df ), len ( df ) + 12 )
low , median , high = np . quantile ( forecast [ 0 ]. numpy (), [ 0.1 , 0.5 , 0.9 ], axis = 0 )

plt . figure ( figsize = ( 8 , 4 ))
plt . plot ( df [ "#Passengers" ], color = "royalblue" , label = "historical data" )
plt . plot ( forecast_index , median , color = "tomato" , label = "median forecast" )
plt . fill_between ( forecast_index , low , high , color = "tomato" , alpha = 0.3 , label = "80% prediction interval" )
plt . legend ()
plt . grid ()
plt . show ()

提取編碼器嵌入

一個展示如何從 Chronos 模型中提取編碼器嵌入的最小範例：

 import pandas as pd
import torch
from chronos import ChronosPipeline

pipeline = ChronosPipeline . from_pretrained (
    "amazon/chronos-t5-small" ,
    device_map = "cuda" ,
    torch_dtype = torch . bfloat16 ,
)

df = pd . read_csv ( "https://raw.githubusercontent.com/AileenNielsen/TimeSeriesAnalysisWithPython/master/data/AirPassengers.csv" )

# context must be either a 1D tensor, a list of 1D tensors,
# or a left-padded 2D tensor with batch as the first dimension
context = torch . tensor ( df [ "#Passengers" ])
embeddings , tokenizer_state = pipeline . embed ( context )

預訓練、微調和評估

用於預訓練、微調和評估 Chronos 模型的腳本可以在此資料夾中找到。

？數據集

Chronos 論文中用於預先訓練和評估的資料集（域內和零樣本）可透過 HuggingFace 儲存庫取得： autogluon/chronos_datasets和autogluon/chronos_datasets_extra 。查看這些儲存庫以取得有關如何下載和使用資料集的說明。

覆蓋範圍

調整語言模型架構以進行時間序列預測（Amazon Science 部落格文章）
Amazon AI 研究人員推出 Chronos：用於預訓練機率時間序列模型的新機器學習框架（Marktechpost 部落格文章）
Chronos：時間序列預測基礎模型的興起（Luís Roque 和 Rafael Guedes 的邁向資料科學部落格文章）
Moirai：通用預測的時間序列基礎模型（Luís Roque 和 Rafael Guedes 撰寫的邁向資料科學部落格文章，包括 Chronos 與 Moirai 的比較）
Chronos：亞馬遜最新的時間序列預測基礎模型（Marco Peixeiro 的邁向資料科學部落格文章）
- 原文有一個嚴重的錯誤，影響了 Chronos 的度量計算。我們提出了一個拉取請求來修復它。
如何使用 Amazon 新的時間序列預測模型有效預測時間序列（Eivind Kjosbakken 的走向資料科學部落格文章）
Chronos：學習時間序列的語言（最大限度地減少遺憾部落格文章，作者：Tim Radtke）
Chronos：另一個零樣本時間序列預測法學碩士（Level Up Coding AI TutorMaster 的 Level Up Coding 部落格文章）
論文評論：Chronos：學習時間序列語言（Andrey Lukyanenko 評論）
預測的基礎模型：未來還是愚蠢？（Radix 的部落格文章）
使用 Chronos 學習時間序列語言（Manuele Caddeo 的中型貼文）
AWS 時間序列預測的最新進展：Chronos（Abish Pius 的中型貼文）
解碼未來：Chronos 如何用語言藝術重新定義時間序列預測（Zamal 的中型貼文）
Chronos 與 SCUM 統計模型整合的比較（Nixtla 的基準）
- 我們提出了一個拉取請求，將分析擴展到 28 個資料集（200K+ 時間序列），並表明零樣本Chronos 模型的效能與這個由 4 個統計模型組成的強大集合相當，同時平均速度明顯更快。我們的完整回應可以在這裡找到。
Chronos 與各種預測模型的比較（ReadyTensor 的基準）

引文

如果您發現 Chronos 模型對您的研究有用，請考慮引用相關論文：

 @article{ansari2024chronos,
  author  = {Ansari, Abdul Fatir and Stella, Lorenzo and Turkmen, Caner and Zhang, Xiyuan and Mercado, Pedro and Shen, Huibin and Shchur, Oleksandr and Rangapuram, Syama Syndar and Pineda Arango, Sebastian and Kapoor, Shubham and Zschiegner, Jasper and Maddix, Danielle C. and Wang, Hao and Mahoney, Michael W. and Torkkola, Kari and Gordon Wilson, Andrew and Bohlke-Schneider, Michael and Wang, Yuyang},
  title   = {Chronos: Learning the Language of Time Series},
  journal = {arXiv preprint arXiv:2403.07815},
  year    = {2024}
}