CASPR es un marco basado en transformadores para el aprendizaje profundo a partir de datos secuenciales en formato tabular, más común en aplicaciones empresariales.
Las tareas críticas para la rentabilidad empresarial, como la predicción de la pérdida de clientes, la detección de cuentas fraudulentas o la estimación del valor de vida del cliente, a menudo se abordan mediante modelos entrenados en funciones diseñadas a partir de datos de clientes en formato tabular. Sin embargo, la ingeniería de características específicas de la aplicación agrega costos de desarrollo, operacionalización y mantenimiento con el tiempo. Los avances recientes en el aprendizaje de representación presentan una oportunidad para simplificar y generalizar la ingeniería de funciones en todas las aplicaciones.
Con CASPR proponemos un enfoque novedoso para codificar datos secuenciales en formato tabular (por ejemplo, transacciones de clientes, historial de compras y otras interacciones) en una representación genérica de la asociación de un sujeto (por ejemplo, el cliente) con el negocio. Evaluamos estas incorporaciones como características para entrenar múltiples modelos que abarcan una variedad de aplicaciones (ver: artículo). CASPR, predicción y representación basada en secuencias de actividades del cliente, aplica una arquitectura de transformador para codificar secuencias de actividades para mejorar el rendimiento del modelo y evitar la ingeniería de funciones personalizadas en todas las aplicaciones. Nuestros experimentos a escala validan CASPR para aplicaciones empresariales tanto pequeñas como grandes.
CASPR: Predicción y representación basada en secuencias de actividad del cliente (NeurIPS 2022, Nueva Orleans: Aprendizaje de representación tabular)
Construir
python==3.9, setuptools
python setup.py build bdist_wheel
Instalación
(now)
pip install .distAI.Models.CASPR-<ver>.whl[<optional-env-modifier>]
(future)
pip install AI.Models.CASPR[<optional-env-modifier>]
utilice cualquiera de los siguientes modificadores para personalizar la instalación para el sistema/caso de uso de destino:
horovod - for distributed training and inference on Horovod
databricks - for distributed training and inference on Databricks
aml - for (distributed) training and inference on Azure ML
hdi - for execution on Azure HD Insights
xai - to enable explainability
test - for extended test execution
dev - for development purposes only
Ejemplos
(TODO: ¿podemos señalar uno de nuestros ejemplos bien comentado con o sin datos?)
¡Agradecemos las contribuciones! Consulte las pautas de contribución.
Para solicitudes de funciones o informes de errores, presente un problema de GitHub.
Este proyecto ha adoptado el Código de conducta de código abierto de Microsoft. Para obtener más información, consulte las preguntas frecuentes sobre el Código de conducta o comuníquese con [email protected] si tiene alguna pregunta o comentario adicional.
Este proyecto está bajo la licencia MIT.