Temporian ist eine Bibliothek für die sichere , einfache und effiziente Vorverarbeitung und Feature-Entwicklung zeitlicher Daten in Python. Temporian unterstützt multivariate Zeitreihen, multivariate Zeitsequenzen, Ereignisprotokolle und quellenübergreifende Ereignisströme.
Temporian ist für zeitliche Daten das, was Pandas für tabellarische Daten ist.
Unterstützt die meisten Arten von Zeitdaten ?: Verarbeitet sowohl einheitlich abgetastete als auch nicht einheitlich abgetastete Daten, sowohl einvariate als auch multivariate Daten, sowohl flache als auch Multi-Index-Daten sowie nicht synchronisierte Ereignisse aus einer Quelle und mehreren Quellen.
Optimiert für zeitliche Daten : Die Kernberechnung von Temporian ist in C++ implementiert und für zeitliche Daten optimiert. Temporian kann bei der Verarbeitung zeitlicher Daten mehr als 1.000-mal schneller sein als handelsübliche Datenverarbeitungsbibliotheken.
Einfache Integration in ein bestehendes ML-Ökosystem : Temporian führt kein ML-Modelltraining durch – stattdessen lässt es sich nahtlos in jede ML-Bibliothek wie PyTorch, Scikit-Learn, Jax, TensorFlow, XGBoost oder Yggdrasil Decision Forests integrieren.
Verhindert unerwünschte zukünftige Lecks ?: Sofern nicht ausdrücklich mit tp.leak
angegeben, kann die Feature-Berechnung nicht von zukünftigen Daten abhängen, wodurch unerwünschte, schwer zu debuggende und möglicherweise kostspielige zukünftige Lecks verhindert werden.
Installieren Sie Temporian von PyPI mit pip
:
pip install temporian -U
Temporian ist derzeit für Linux und MacOS (ARM und Intel) verfügbar. Die Windows-Unterstützung befindet sich in der Entwicklung.
Berücksichtigen Sie Verkaufsdatensätze, die den timestamp
, store
und revenue
einzelner Verkäufe enthalten.
$ cat sales.csv
timestamp,store,revenue
2023-12-04 21:21:05,STORE_31,5071
2023-11-08 17:14:38,STORE_4,1571
2023-11-29 21:44:46,STORE_49,6101
2023-12-20 18:17:14,STORE_18,4499
2023-12-15 10:55:09,STORE_2,6666
...
Unser Ziel ist es, die Summe der Einnahmen für jedes Geschäft an jedem Wochentag (außer an Wochenenden) um 23:00 Uhr zu berechnen.
Zuerst laden wir die Daten und listen die Arbeitstage auf.
import temporian as tp
# Load sale transactions
sales = tp . from_csv ( "sales.csv" )
# Index sales per store
sales_per_store = sales . add_index ( "store" )
# List work days
days = sales_per_store . tick_calendar ( hour = 22 )
work_days = ( days . calendar_day_of_week () <= 5 ). filter ()
work_days . plot ( max_num_plots = 1 )
Dann summieren wir den Tagesumsatz für jeden Arbeitstag und jede Filiale.
# Aggregate revenue per store and per work day
daily_revenue = sales_per_store [ "revenue" ]. moving_sum ( tp . duration . days ( 1 ), sampling = work_days ). rename ( "daily_revenue" )
# Plot the results
daily_revenue . plot ( max_num_plots = 3 )
Schließlich können wir das Ergebnis als Pandas DataFrame zur weiteren Verarbeitung oder zur Nutzung durch andere Bibliotheken exportieren.
tp . to_pandas ( daily_revenue )
Schauen Sie sich das Tutorial „Erste Schritte“ an, um mehr zu erfahren!
Neue Benutzer sollten sich das Handbuch „Erste Schritte“ ansehen, das einen schnellen Überblick über die wichtigsten Konzepte und Funktionen von Temporian bietet.
Besuchen Sie anschließend das Benutzerhandbuch, um einen tiefen Einblick in die wichtigsten Konzepte, Operatoren, Konventionen und Praktiken von Temporian zu erhalten. Für eine praktische Lernerfahrung arbeiten Sie die Tutorials durch oder sehen Sie sich die API-Referenz an.
Wenn Sie Hilfe benötigen, eine Frage haben, einen Beitrag leisten oder einfach nur Teil der Temporian-Community sein möchten, empfehlen wir Ihnen, unserem Discord-Server beizutreten! ??
Die Dokumentation ist unter temporian.readthedocs.io verfügbar. Der Leitfaden „Erste Schritte“ ist der beste Einstieg.
Beiträge zu Temporian sind willkommen! Schauen Sie sich den Beitragsleitfaden an, um loszulegen.
Temporian wurde in Zusammenarbeit zwischen Google und Tryolabs entwickelt.