TimeGPT 는 생산 준비가 완료된 시계열용 사전 학습된 생성 변환기입니다. 단 몇 줄의 코드만으로 소매, 전기, 금융, IoT 등 다양한 영역을 정확하게 예측할 수 있습니다.
pip install nixtla >= 0.5 . 1
import pandas as pd
from nixtla import NixtlaClient
# Get your API Key at dashboard.nixtla.io
# 1. Instantiate the NixtlaClient
nixtla_client = NixtlaClient ( api_key = 'YOUR API KEY HERE' )
# 2. Read historic electricity demand data
df = pd . read_csv ( 'https://raw.githubusercontent.com/Nixtla/transfer-learning-time-series/main/datasets/electricity-short.csv' )
# 3. Forecast the next 24 hours
fcst_df = nixtla_client . forecast ( df , h = 24 , level = [ 80 , 90 ])
# 4. Plot your results (optional)
nixtla_client . plot ( df , fcst_df , level = [ 80 , 90 ])
# Get your API Key at dashboard.nixtla.io
# 1. Instantiate the NixtlaClient
nixtla_client = NixtlaClient ( api_key = 'YOUR API KEY HERE' )
# 2. Read Data # Wikipedia visits of NFL Star (
df = pd . read_csv ( 'https://datasets-nixtla.s3.amazonaws.com/peyton-manning.csv' )
# 3. Detect Anomalies
anomalies_df = nixtla_client . detect_anomalies ( df , time_col = 'timestamp' , target_col = 'value' , freq = 'D' )
# 4. Plot your results (optional)
nixtla_client . plot ( df , anomalies_df , time_col = 'timestamp' , target_col = 'value' )
API 참조를 탐색하여 JavaScript, Go 등을 포함한 다양한 프로그래밍 언어에서 TimeGPT를 활용하는 방법을 알아보세요.
제로샷 추론 : TimeGPT는 예측을 생성하고 사전 교육 데이터가 필요 없이 즉시 이상 현상을 감지할 수 있습니다. 이를 통해 모든 시계열 데이터에서 즉각적인 배포와 빠른 통찰력을 얻을 수 있습니다.
미세 조정 : 특정 데이터세트에 대한 모델을 미세 조정하여 모델이 고유한 시계열 데이터의 미묘한 차이에 적응하고 맞춤형 작업의 성능을 향상함으로써 TimeGPT의 기능을 향상합니다.
API 액세스 : 강력한 API를 통해 TimeGPT를 애플리케이션에 원활하게 통합합니다. Azure Studio에 대한 향후 지원은 훨씬 더 유연한 통합 옵션을 제공할 것입니다. 또는 자체 인프라에 TimeGPT를 배포하여 데이터와 워크플로를 완벽하게 제어할 수 있습니다.
외생변수 추가 : 예측 정확도를 높이기 위해 예측에 영향을 미칠 수 있는 추가 변수를 통합합니다. (예: 특별 날짜, 이벤트 또는 가격)
다중 계열 예측 : 여러 시계열 데이터를 동시에 예측하여 워크플로와 리소스를 최적화합니다.
맞춤형 손실 함수 : 특정 성능 지표를 충족하기 위해 맞춤형 손실 함수로 미세 조정 프로세스를 조정합니다.
교차 검증 : 모델의 견고성과 일반화 가능성을 보장하기 위해 즉시 사용 가능한 교차 검증 기술을 구현합니다.
예측 간격 : 예측에 간격을 제공하여 불확실성을 효과적으로 정량화합니다.
Irregular Timestamps : 불규칙한 타임스탬프가 있는 데이터를 처리하여 전처리 없이 균일하지 않은 간격 계열을 수용합니다.
TimeGPT의 예시와 실제 사용 사례를 알아보려면 포괄적인 문서를 살펴보세요. 당사의 문서는 다음을 포함한 광범위한 주제를 다루고 있습니다.
시작하기 : 사용자 친화적인 빠른 시작 가이드로 시작하여 손쉽게 API 키를 설정하는 방법을 알아보세요.
고급 기술 : 이상 감지, 특정 손실 함수를 사용한 모델 미세 조정, Spark, Dask, Ray와 같은 분산 프레임워크 전반의 계산 확장에 대한 튜토리얼을 통해 고급 예측 방법을 익히고 모델 정확도를 향상시키는 방법을 알아보세요.
전문 주제 : 외생 변수 처리, 교차 검증을 통한 모델 검증, 불확실성 하 예측 전략과 같은 전문 주제를 탐색합니다.
실제 응용 프로그램 : 웹 트래픽 예측 및 비트코인 가격 예측에 대한 사례 연구를 통해 TimeGPT가 실제 시나리오에 어떻게 적용되는지 알아보세요.
시계열 데이터는 금융, 의료, 기상학, 사회과학 등 다양한 부문에서 중추적인 역할을 합니다. 바다의 조수를 모니터링하든 다우존스 일일 종가를 추적하든 시계열 데이터는 예측과 의사결정에 매우 중요합니다.
ARIMA, ETS, MSTL, Theta, CES와 같은 전통적인 분석 방법, XGBoost 및 LightGBM과 같은 기계 학습 모델, 딥 러닝 접근 방식은 분석가를 위한 표준 도구였습니다. 그러나 TimeGPT는 뛰어난 성능, 효율성 및 단순성을 통해 패러다임 전환을 도입했습니다. 제로샷 추론 기능 덕분에 TimeGPT는 분석 프로세스를 간소화하여 코딩 경험이 거의 없는 사용자도 액세스할 수 있도록 합니다.
TimeGPT는 사용자 친화적이고 로우 코드이므로 사용자는 단 한 줄의 코드로 시계열 데이터를 업로드하고 예측을 생성하거나 이상 현상을 감지할 수 있습니다. 즉시 사용 가능한 시계열 분석을 위한 유일한 기반 모델인 TimeGPT는 공개 API, Azure Studio(곧 출시 예정)를 통해 통합하거나 자체 인프라에 배포할 수 있습니다.
"Attention is all you need"라는 논문에서 소개된 혁명적인 개념인 Self-attention이 이 기본 모델의 기초입니다. TimeGPT 모델은 기존 LLM(대형 언어 모델)을 기반으로 하지 않습니다. 대규모 변환기 모델로서 방대한 시계열 데이터 세트를 독립적으로 학습하고 예측 오류를 최소화하도록 설계되었습니다.
아키텍처는 각 레이어에 잔여 연결과 레이어 정규화가 포함된 여러 레이어가 있는 인코더-디코더 구조로 구성됩니다. 마지막으로 선형 레이어는 디코더의 출력을 예측 창 차원에 매핑합니다. 일반적인 직관은 주의 기반 메커니즘이 과거 사건의 다양성을 포착하고 잠재적인 미래 분포를 정확하게 추정할 수 있다는 것입니다.
TimeGPT는 우리가 아는 한, 총 1,000억 개가 넘는 데이터 포인트를 포함하는 공개적으로 사용 가능한 가장 큰 시계열 컬렉션에 대해 교육을 받았습니다. 이 교육 세트에는 금융, 경제, 인구 통계, 의료, 날씨, IoT 센서 데이터, 에너지, 웹 트래픽, 판매, 운송 및 은행 업무를 포함한 광범위한 영역의 시계열이 통합되어 있습니다. 이러한 다양한 도메인 세트로 인해 훈련 데이터 세트에는 다양한 특성을 가진 시계열이 포함됩니다.
TimeGPT는 테스트 데이터 세트에 대한 추가 미세 조정 없이 모델을 사용하는 300,000개가 넘는 고유 계열에 대한 제로샷 추론 기능에 대해 테스트되었습니다. TimeGPT는 잘 정립된 통계 및 최첨단 딥 러닝 모델의 포괄적인 범위를 능가하며 다양한 주파수에서 지속적으로 상위 3위 안에 들었습니다.
TimeGPT는 또한 사전 훈련된 모델을 사용하여 간단하고 빠른 예측을 제공한다는 점에서 탁월합니다. 이는 일반적으로 광범위한 교육 및 예측 파이프라인이 필요한 다른 모델과 극명한 대조를 이룹니다.
제로샷 추론의 경우 내부 테스트에서는 TimeGPT에 대해 시리즈당 평균 GPU 추론 속도가 0.6밀리초로 기록되었으며 이는 단순한 Seasonal Naive의 속도와 거의 유사합니다.
TimeGPT가 귀하의 연구에 유용하다고 생각되면 관련 논문 인용을 고려해 보십시오.
@misc{garza2023timegpt1,
title={TimeGPT-1},
author={Azul Garza and Max Mergenthaler-Canseco},
year={2023},
eprint={2310.03589},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
TimeGPT는 많은 출판물에 소개되었으며 시계열 예측에 대한 혁신적인 접근 방식으로 인정을 받았습니다. 다음은 몇 가지 기능과 언급입니다.
TimeGPT는 비공개 소스입니다. 그러나 이 SDK는 오픈 소스이며 Apache 2.0 라이선스에 따라 사용할 수 있습니다. 자유롭게 기여해 주세요(자세한 내용은 기여 가이드를 확인하세요).
질문이나 의견이 있으시면 언제든지 ops [at] nixtla.io로 문의해 주세요.