CASPR
1.0.0
CASPR 是一个基于转换器的框架,用于从表格格式的顺序数据进行深度学习,在业务应用程序中最常见。
对企业盈利能力至关重要的任务,例如客户流失预测、欺诈帐户检测或客户生命周期价值估计,通常是通过根据表格格式的客户数据设计的特征训练的模型来解决的。然而,随着时间的推移,特定于应用程序的功能工程会增加开发、运营和维护成本。表示学习的最新进展为跨应用程序简化和泛化特征工程提供了机会。
通过CASPR,我们提出了一种新颖的方法,将表格格式的顺序数据(例如,客户交易、购买历史和其他交互)编码为主体(例如,客户)与业务关联的通用表示。我们将这些嵌入评估为训练跨各种应用程序的多个模型的特征(参见:论文)。 CASPR(基于客户活动序列的预测和表示)应用 Transformer 架构对活动序列进行编码,以提高模型性能并避免跨应用程序进行定制特征工程。我们的大规模实验验证了小型和大型企业应用程序的 CASPR。
CASPR:基于客户活动序列的预测和表示(NeurIPS 2022,新奥尔良:表格表示学习)
建造
python==3.9, setuptools
python setup.py build bdist_wheel
安装
(now)
pip install .distAI.Models.CASPR-<ver>.whl[<optional-env-modifier>]
(future)
pip install AI.Models.CASPR[<optional-env-modifier>]
使用以下任何修饰符来自定义目标系统/用例的安装:
horovod - for distributed training and inference on Horovod
databricks - for distributed training and inference on Databricks
aml - for (distributed) training and inference on Azure ML
hdi - for execution on Azure HD Insights
xai - to enable explainability
test - for extended test execution
dev - for development purposes only
示例
(TODO:我们可以指出我们的一个带有或不带有数据的示例吗?)
我们欢迎贡献!请参阅贡献指南。
对于功能请求或错误报告,请提交 GitHub 问题。
该项目采用了微软开源行为准则。有关详细信息,请参阅行为准则常见问题解答或联系 [email protected] 提出任何其他问题或意见。
该项目已获得 MIT 许可证的许可。