CASPR est un framework basé sur un transformateur pour l'apprentissage en profondeur à partir de données séquentielles au format tabulaire, le plus courant dans les applications métier.
Les tâches essentielles à la rentabilité de l'entreprise, telles que la prévision du taux de désabonnement des clients, la détection des comptes frauduleux ou l'estimation de la valeur à vie du client, sont souvent abordées par des modèles formés sur des fonctionnalités conçues à partir des données clients sous forme de tableau. L’ingénierie de fonctionnalités spécifiques à l’application ajoute cependant des coûts de développement, d’opérationnalisation et de maintenance au fil du temps. Les progrès récents dans l’apprentissage des représentations offrent l’opportunité de simplifier et de généraliser l’ingénierie des fonctionnalités dans toutes les applications.
Avec CASPR, nous proposons une nouvelle approche pour coder des données séquentielles sous forme de tableau (par exemple, transactions clients, historique d'achat et autres interactions) dans une représentation générique de l'association d'un sujet (par exemple, client) avec l'entreprise. Nous évaluons ces intégrations en tant que fonctionnalités permettant de former plusieurs modèles couvrant une variété d'applications (voir : article). CASPR, Customer Activity Sequence-based Prediction and Representation, applique une architecture de transformateur pour coder les séquences d'activités afin d'améliorer les performances du modèle et d'éviter l'ingénierie de fonctionnalités sur mesure dans les applications. Nos expériences à grande échelle valident CASPR pour les applications des petites et grandes entreprises.
CASPR : Prédiction et représentation basées sur la séquence d'activité client (NeurIPS 2022, Nouvelle-Orléans : Apprentissage par représentation tabulaire)
Construire
python==3.9, setuptools
python setup.py build bdist_wheel
Installation
(now)
pip install .distAI.Models.CASPR-<ver>.whl[<optional-env-modifier>]
(future)
pip install AI.Models.CASPR[<optional-env-modifier>]
utilisez l'un des modificateurs ci-dessous pour personnaliser l'installation pour le système cible/le cas d'utilisation :
horovod - for distributed training and inference on Horovod
databricks - for distributed training and inference on Databricks
aml - for (distributed) training and inference on Azure ML
hdi - for execution on Azure HD Insights
xai - to enable explainability
test - for extended test execution
dev - for development purposes only
Exemples
(À FAIRE : pouvons-nous citer un de nos exemples bien commenté avec ou sans données ?)
Nous apprécions les contributions ! Veuillez consulter les directives de contribution.
Pour les demandes de fonctionnalités ou les rapports de bogues, veuillez déposer un problème GitHub.
Ce projet a adopté le code de conduite Microsoft Open Source. Pour plus d’informations, consultez la FAQ sur le code de conduite ou contactez [email protected] pour toute question ou commentaire supplémentaire.
Ce projet est sous licence MIT.