Temporian 은 Python에서 시간 데이터의 안전하고 간단 하며 효율적인 전처리 및 기능 엔지니어링을 위한 라이브러리입니다. Temporian은 다변량 시계열, 다변량 시간 순서, 이벤트 로그 및 소스 간 이벤트 스트림을 지원합니다.
Temporian은 시간 데이터에 대한 것이고, Pandas는 표 형식 데이터에 대한 것입니다.
대부분의 시간 데이터 유형 지원 ?: 균일하게 샘플링된 데이터와 불균일하게 샘플링된 데이터, 단일 변량 및 다변량 데이터, 플랫 및 다중 인덱스 데이터, 단일 소스 및 다중 소스 비동기 이벤트를 모두 처리합니다.
시간 데이터에 최적화 : Temporian의 핵심 계산은 C++로 구현되었으며 시간 데이터에 최적화되었습니다. Temporian은 시간 데이터를 작업할 때 기성 데이터 처리 라이브러리보다 1,000배 이상 빠릅니다.
기존 ML 생태계에 쉽게 통합 : Temporian은 ML 모델 교육을 수행하지 않고 대신 PyTorch, Scikit-Learn, Jax, TensorFlow, XGBoost 또는 Yggdrasil Decision Forests와 같은 모든 ML 라이브러리와 원활하게 통합됩니다.
원치 않는 향후 누출 방지 ?: tp.leak
로 명시적으로 지정하지 않는 한 기능 계산은 향후 데이터에 의존할 수 없으므로 원치 않고 디버그하기 어렵고 잠재적으로 비용이 많이 드는 향후 누출을 방지할 수 있습니다.
pip
사용하여 PyPI에서 Temporian을 설치합니다.
pip install temporian -U
Temporian은 현재 Linux 및 MacOS(ARM 및 Intel)에서 사용할 수 있습니다. Windows 지원은 개발 중입니다.
개별 판매의 timestamp
, store
및 revenue
포함된 판매 레코드를 고려하세요.
$ cat sales.csv
timestamp,store,revenue
2023-12-04 21:21:05,STORE_31,5071
2023-11-08 17:14:38,STORE_4,1571
2023-11-29 21:44:46,STORE_49,6101
2023-12-20 18:17:14,STORE_18,4499
2023-12-15 10:55:09,STORE_2,6666
...
우리의 목표는 매주 평일(주말 제외) 오후 11시에 각 매장의 매출 합계를 계산하는 것입니다.
먼저 데이터를 로드하고 근무일을 나열합니다.
import temporian as tp
# Load sale transactions
sales = tp . from_csv ( "sales.csv" )
# Index sales per store
sales_per_store = sales . add_index ( "store" )
# List work days
days = sales_per_store . tick_calendar ( hour = 22 )
work_days = ( days . calendar_day_of_week () <= 5 ). filter ()
work_days . plot ( max_num_plots = 1 )
그런 다음 각 근무일과 각 매장의 일일 수익을 합산합니다.
# Aggregate revenue per store and per work day
daily_revenue = sales_per_store [ "revenue" ]. moving_sum ( tp . duration . days ( 1 ), sampling = work_days ). rename ( "daily_revenue" )
# Plot the results
daily_revenue . plot ( max_num_plots = 3 )
마지막으로 추가 처리를 위해 또는 다른 라이브러리에서 사용할 수 있도록 결과를 Pandas DataFrame으로 내보낼 수 있습니다.
tp . to_pandas ( daily_revenue )
자세한 내용은 시작하기 튜토리얼을 확인하세요!
새로운 사용자는 Temporian의 주요 개념과 작동에 대한 빠른 개요를 제공하는 시작하기 가이드를 참조해야 합니다.
그런 다음 사용자 가이드를 방문하여 Temporian의 주요 개념, 연산자, 규칙 및 관행에 대해 자세히 알아보세요. 실습 학습 경험을 얻으려면 튜토리얼을 진행하거나 API 참조를 참조하세요.
도움이 필요하거나, 질문이 있거나, 기여하고 싶거나, Temporian 커뮤니티의 일원이 되고 싶다면 Discord 서버에 가입하는 것이 좋습니다! ??
문서는 temporian.readthedocs.io에서 확인할 수 있습니다. 시작하기 가이드가 가장 좋은 시작 방법입니다.
Temporian에 대한 기여를 환영합니다! 시작하려면 기여 가이드를 확인하세요.
Temporian은 Google과 Tryolabs의 협력으로 개발되었습니다.