CASPR は、ビジネス アプリケーションで最も一般的な、表形式の連続データからディープ ラーニングを行うためのトランスフォーマー ベースのフレームワークです。
顧客離れの予測、不正なアカウントの検出、顧客生涯価値の推定など、企業の収益性にとって重要なタスクは、多くの場合、表形式の顧客データから設計された機能でトレーニングされたモデルによって取り組まれます。ただし、アプリケーション固有の機能エンジニアリングでは、時間の経過とともに開発、運用、メンテナンスのコストが増加します。表現学習の最近の進歩により、アプリケーション全体で特徴量エンジニアリングを簡素化し、一般化する機会が生まれました。
CASPRを使用して、表形式の連続データ (顧客トランザクション、購入履歴、その他のインタラクションなど) を、対象者 (顧客など) とビジネスとの関連性の一般的な表現にエンコードする新しいアプローチを提案します。私たちはこれらの埋め込みを、さまざまなアプリケーションにわたる複数のモデルをトレーニングするための機能として評価します (論文を参照)。 CASPR (Customer Activity Sequence-based Prediction and Representation) は、トランスフォーマー アーキテクチャを適用してアクティビティ シーケンスをエンコードし、モデルのパフォーマンスを向上させ、アプリケーション全体にわたる特注の特徴エンジニアリングを回避します。私たちの大規模な実験では、小規模企業と大規模企業の両方のアプリケーションに対して CASPR が検証されています。
CASPR: 顧客アクティビティのシーケンスベースの予測と表現(NeurIPS 2022、ニューオーリンズ: 表形式表現学習)
建てる
python==3.9, setuptools
python setup.py build bdist_wheel
インストール
(now)
pip install .distAI.Models.CASPR-<ver>.whl[<optional-env-modifier>]
(future)
pip install AI.Models.CASPR[<optional-env-modifier>]
以下の修飾子のいずれかを使用して、ターゲット システム/ユースケースに合わせてインストールをカスタマイズします。
horovod - for distributed training and inference on Horovod
databricks - for distributed training and inference on Databricks
aml - for (distributed) training and inference on Azure ML
hdi - for execution on Azure HD Insights
xai - to enable explainability
test - for extended test execution
dev - for development purposes only
例
(TODO: データありまたはデータなしの例のうち、よくコメントされたものを 1 つ挙げていただけますか?)
寄付を歓迎します!投稿ガイドラインをご覧ください。
機能リクエストやバグレポートについては、GitHub Issue を提出してください。
このプロジェクトはマイクロソフトのオープンソース行動規範を採用しています。詳細については、「行動規範に関するよくある質問」を参照するか、追加の質問やコメントがあれば [email protected] までお問い合わせください。
このプロジェクトは MIT ライセンスに基づいてライセンスされています。