Temporianは、Python で時系列データを安全かつシンプルかつ効率的に前処理および特徴エンジニアリングするためのライブラリです。 Temporian は、多変量時系列、多変量時系列、イベント ログ、およびクロスソース イベント ストリームをサポートします。
Temporian は時間データにとって、Pandas は表形式データにとって同様です。
ほとんどの種類の時間データをサポートします?: 均一にサンプリングされたデータと不均一にサンプリングされたデータの両方、単変量データと多変量データの両方、フラット データとマルチインデックス データの両方、およびモノソースとマルチソースの両方の非同期イベントを処理します。
時間データ用に最適化: Temporian のコア計算は C++ で実装され、時間データ用に最適化されています。 Temporian は、テンポラル データを操作する場合、既製のデータ処理ライブラリよりも 1,000 倍以上高速になります。
既存の ML エコシステムへの統合が簡単: Temporian は ML モデルのトレーニングを実行しません。代わりに、PyTorch、Scikit-Learn、Jax、TensorFlow、XGBoost、Yggdrasil Decision Forests などの ML ライブラリとシームレスに統合します。
将来の望ましくない漏洩を防ぐ?: tp.leak
で明示的に指定しない限り、特徴の計算は将来のデータに依存できないため、望ましくない、デバッグが難しく、コストがかかる可能性のある将来の漏洩を防ぎます。
pip
を使用して PyPI から Temporian をインストールします。
pip install temporian -U
Temporian は現在、Linux および MacOS (ARM および Intel) で利用できます。 Windows のサポートは開発中です。
個々の販売のtimestamp
、 store
、およびrevenue
を含む販売レコードを考えてみましょう。
$ cat sales.csv
timestamp,store,revenue
2023-12-04 21:21:05,STORE_31,5071
2023-11-08 17:14:38,STORE_4,1571
2023-11-29 21:44:46,STORE_49,6101
2023-12-20 18:17:14,STORE_18,4499
2023-12-15 10:55:09,STORE_2,6666
...
私たちの目標は、毎週 (週末を除く) 午後 11 時の各店舗の収益の合計を計算することです。
まず、データをロードし、稼働日をリストします。
import temporian as tp
# Load sale transactions
sales = tp . from_csv ( "sales.csv" )
# Index sales per store
sales_per_store = sales . add_index ( "store" )
# List work days
days = sales_per_store . tick_calendar ( hour = 22 )
work_days = ( days . calendar_day_of_week () <= 5 ). filter ()
work_days . plot ( max_num_plots = 1 )
次に、各営業日および各店舗の 1 日の収益を合計します。
# Aggregate revenue per store and per work day
daily_revenue = sales_per_store [ "revenue" ]. moving_sum ( tp . duration . days ( 1 ), sampling = work_days ). rename ( "daily_revenue" )
# Plot the results
daily_revenue . plot ( max_num_plots = 3 )
最後に、結果を Pandas DataFrame としてエクスポートして、さらに処理したり、他のライブラリで使用したりできます。
tp . to_pandas ( daily_revenue )
詳細については、「はじめに」チュートリアルをご覧ください。
新しいユーザーは、Temporian の主要な概念と操作の概要を説明する入門ガイドを参照してください。
その後、ユーザー ガイドにアクセスして、Temporian の主要な概念、演算子、規約、実践方法を詳しく理解してください。実践的な学習体験については、チュートリアルに取り組むか、API リファレンスを参照してください。
サポートが必要な場合、質問がある場合、貢献したい場合、または単に Temporian コミュニティの一員になりたい場合は、Discord サーバーに参加することをお勧めします。 ??
ドキュメントはtemporian.readthedocs.ioで入手できます。スタートガイドは、始めるのに最適な方法です。
Temporian への貢献は大歓迎です!開始するには、貢献ガイドを参照してください。
Temporian は、Google と Tryolabs の共同開発により開発されました。