CASPR
1.0.0
CASPR 是一個基於轉換器的框架,用於從表格格式的順序資料進行深度學習,在業務應用程式中最常見。
對企業獲利能力至關重要的任務,例如客戶流失預測、詐欺帳戶偵測或客戶生命週期價值估計,通常是透過根據表格格式的客戶資料設計的特徵訓練的模型來解決的。然而,隨著時間的推移,特定於應用程式的功能工程會增加開發、營運和維護成本。表示學習的最新進展為跨應用程式簡化和泛化特徵工程提供了機會。
透過CASPR,我們提出了一種新穎的方法,將表格格式的順序資料(例如,客戶交易、購買歷史和其他互動)編碼為主體(例如,客戶)與業務關聯的通用表示。我們將這些嵌入評估為訓練跨各種應用程式的多個模型的特徵(參見:論文)。 CASPR(基於客戶活動序列的預測和表示)應用 Transformer 架構對活動序列進行編碼,以提高模型效能並避免跨應用程式進行客製化特徵工程。我們的大規模實驗驗證了小型和大型企業應用程式的 CASPR。
CASPR:基於客戶活動序列的預測和表示(NeurIPS 2022,新奧爾良:表格表示學習)
建造
python==3.9, setuptools
python setup.py build bdist_wheel
安裝
(now)
pip install .distAI.Models.CASPR-<ver>.whl[<optional-env-modifier>]
(future)
pip install AI.Models.CASPR[<optional-env-modifier>]
使用以下任何修飾符來自訂目標系統/用例的安裝:
horovod - for distributed training and inference on Horovod
databricks - for distributed training and inference on Databricks
aml - for (distributed) training and inference on Azure ML
hdi - for execution on Azure HD Insights
xai - to enable explainability
test - for extended test execution
dev - for development purposes only
範例
(TODO:我們可以指出我們的一個有或沒有資料的範例嗎?)
我們歡迎貢獻!請參閱貢獻指南。
對於功能請求或錯誤報告,請提交 GitHub 問題。
該專案採用了微軟開源行為準則。有關詳細信息,請參閱行為準則常見問題解答或聯繫 [email protected] 提出任何其他問題或意見。
該項目已獲得 MIT 許可證的許可。