CASPR adalah kerangka kerja berbasis transformator untuk pembelajaran mendalam dari data sekuensial dalam format tabel, yang paling umum dalam aplikasi bisnis.
Tugas-tugas penting bagi profitabilitas perusahaan, seperti prediksi churn pelanggan, deteksi akun palsu, atau estimasi nilai seumur hidup pelanggan, sering kali ditangani oleh model yang dilatih berdasarkan fitur yang direkayasa dari data pelanggan dalam format tabel. Namun rekayasa fitur khusus aplikasi menambah biaya pengembangan, operasionalisasi, dan pemeliharaan seiring waktu. Kemajuan terkini dalam pembelajaran representasi menghadirkan peluang untuk menyederhanakan dan menggeneralisasi rekayasa fitur di seluruh aplikasi.
Dengan CASPR kami mengusulkan pendekatan baru untuk mengkodekan data berurutan dalam format tabel (misalnya, transaksi pelanggan, riwayat pembelian, dan interaksi lainnya) ke dalam representasi umum dari hubungan subjek (misalnya, pelanggan) dengan bisnis. Kami mengevaluasi penyematan ini sebagai fitur untuk melatih beberapa model yang mencakup berbagai aplikasi (lihat: makalah). CASPR, Prediksi dan Representasi Berbasis Urutan Aktivitas Pelanggan, menerapkan arsitektur transformator untuk menyandikan urutan aktivitas guna meningkatkan kinerja model dan menghindari rekayasa fitur yang dipesan lebih dahulu di seluruh aplikasi. Eksperimen kami dalam skala besar memvalidasi CASPR untuk aplikasi perusahaan kecil dan besar.
CASPR: Prediksi dan Representasi Berbasis Urutan Aktivitas Pelanggan (NeurIPS 2022, New Orleans: Pembelajaran Representasi Tabular)
Membangun
python==3.9, setuptools
python setup.py build bdist_wheel
Instalasi
(now)
pip install .distAI.Models.CASPR-<ver>.whl[<optional-env-modifier>]
(future)
pip install AI.Models.CASPR[<optional-env-modifier>]
gunakan salah satu pengubah di bawah ini, untuk menyesuaikan instalasi untuk sistem target/kasus penggunaan:
horovod - for distributed training and inference on Horovod
databricks - for distributed training and inference on Databricks
aml - for (distributed) training and inference on Azure ML
hdi - for execution on Azure HD Insights
xai - to enable explainability
test - for extended test execution
dev - for development purposes only
Contoh
(TODO: bisakah kami menunjukkan salah satu contoh kami yang diberi komentar dengan baik tanpa atau tanpa data?)
Kami menyambut kontribusi! Silakan lihat pedoman kontribusi.
Untuk permintaan fitur atau laporan bug, harap ajukan Masalah GitHub.
Proyek ini telah mengadopsi Kode Etik Sumber Terbuka Microsoft. Untuk informasi lebih lanjut lihat FAQ Pedoman Perilaku atau hubungi [email protected] jika ada pertanyaan atau komentar tambahan.
Proyek ini dilisensikan di bawah Lisensi MIT.