CASPR ist ein transformatorbasiertes Framework für Deep Learning aus sequentiellen Daten im Tabellenformat, das am häufigsten in Geschäftsanwendungen verwendet wird.
Aufgaben, die für die Rentabilität eines Unternehmens von entscheidender Bedeutung sind, wie z. B. die Vorhersage der Kundenabwanderung, die Erkennung betrügerischer Konten oder die Schätzung des Customer Lifetime Value, werden häufig durch Modelle gelöst, die auf Funktionen trainiert werden, die aus Kundendaten im Tabellenformat erstellt wurden. Durch anwendungsspezifisches Feature-Engineering steigen jedoch mit der Zeit die Entwicklungs-, Operationalisierungs- und Wartungskosten. Die jüngsten Fortschritte beim Repräsentationslernen bieten die Möglichkeit, das Feature-Engineering anwendungsübergreifend zu vereinfachen und zu verallgemeinern.
Mit CASPR schlagen wir einen neuartigen Ansatz vor, um sequentielle Daten im Tabellenformat (z. B. Kundentransaktionen, Kaufhistorie und andere Interaktionen) in eine generische Darstellung der Verbindung eines Subjekts (z. B. eines Kunden) mit dem Unternehmen zu kodieren. Wir bewerten diese Einbettungen als Funktionen zum Trainieren mehrerer Modelle, die eine Vielzahl von Anwendungen abdecken (siehe: Papier). CASPR (Customer Activity Sequence-based Prediction and Representation) wendet eine Transformer-Architektur an, um Aktivitätssequenzen zu kodieren, um die Modellleistung zu verbessern und anwendungsübergreifendes maßgeschneidertes Feature-Engineering zu vermeiden. Unsere Experimente im großen Maßstab validieren CASPR für kleine und große Unternehmensanwendungen.
CASPR: Customer Activity Sequence-based Prediction and Representation (NeurIPS 2022, New Orleans: Tabular Representation Learning)
Bauen
python==3.9, setuptools
python setup.py build bdist_wheel
Installation
(now)
pip install .distAI.Models.CASPR-<ver>.whl[<optional-env-modifier>]
(future)
pip install AI.Models.CASPR[<optional-env-modifier>]
Verwenden Sie einen der folgenden Modifikatoren, um die Installation für das Zielsystem/den Anwendungsfall anzupassen:
horovod - for distributed training and inference on Horovod
databricks - for distributed training and inference on Databricks
aml - for (distributed) training and inference on Azure ML
hdi - for execution on Azure HD Insights
xai - to enable explainability
test - for extended test execution
dev - for development purposes only
Beispiele
(TODO: Können wir auf eines unserer gut kommentierten Beispiele mit oder ohne Daten verweisen?)
Wir freuen uns über Beiträge! Bitte beachten Sie die Beitragsrichtlinien.
Für Funktionsanfragen oder Fehlerberichte reichen Sie bitte ein GitHub-Problem ein.
Dieses Projekt hat den Microsoft Open Source Verhaltenskodex übernommen. Weitere Informationen finden Sie in den FAQ zum Verhaltenskodex oder wenden Sie sich bei weiteren Fragen oder Kommentaren an [email protected].
Dieses Projekt ist unter der MIT-Lizenz lizenziert.