CASPR é uma estrutura baseada em transformador para aprendizagem profunda a partir de dados sequenciais em formato tabular, mais comum em aplicações de negócios.
Tarefas críticas para a lucratividade empresarial, como previsão de rotatividade de clientes, detecção de contas fraudulentas ou estimativa do valor da vida útil do cliente, são frequentemente realizadas por modelos treinados em recursos projetados a partir de dados de clientes em formato tabular. No entanto, a engenharia de recursos específicos da aplicação acrescenta custos de desenvolvimento, operacionalização e manutenção ao longo do tempo. Avanços recentes no aprendizado de representação apresentam uma oportunidade para simplificar e generalizar a engenharia de recursos entre aplicativos.
Com CASPR propomos uma nova abordagem para codificar dados sequenciais em formato tabular (por exemplo, transações de clientes, histórico de compras e outras interações) em uma representação genérica da associação de um sujeito (por exemplo, cliente) com o negócio. Avaliamos esses embeddings como recursos para treinar vários modelos abrangendo uma variedade de aplicações (ver: papel). CASPR, Previsão e Representação Baseada em Sequência de Atividades do Cliente, aplica arquitetura de transformador para codificar sequências de atividades para melhorar o desempenho do modelo e evitar engenharia de recursos sob medida em aplicativos. Nossos experimentos em escala validam o CASPR para aplicações empresariais de pequeno e grande porte.
CASPR: Previsão e representação baseada em sequência de atividades do cliente (NeurIPS 2022, Nova Orleans: aprendizagem de representação tabular)
Construir
python==3.9, setuptools
python setup.py build bdist_wheel
Instalação
(now)
pip install .distAI.Models.CASPR-<ver>.whl[<optional-env-modifier>]
(future)
pip install AI.Models.CASPR[<optional-env-modifier>]
use qualquer um dos modificadores abaixo para personalizar a instalação do sistema/caso de uso de destino:
horovod - for distributed training and inference on Horovod
databricks - for distributed training and inference on Databricks
aml - for (distributed) training and inference on Azure ML
hdi - for execution on Azure HD Insights
xai - to enable explainability
test - for extended test execution
dev - for development purposes only
Exemplos
(TODO: podemos apontar um de nossos exemplos bem comentados com ou sem dados?)
Aceitamos contribuições! Por favor, consulte as diretrizes de contribuição.
Para solicitações de recursos ou relatórios de bugs, registre um problema no GitHub.
Este projeto adotou o Código de Conduta de Código Aberto da Microsoft. Para obter mais informações, consulte as Perguntas frequentes sobre o Código de Conduta ou entre em contato com [email protected] com perguntas ou comentários adicionais.
Este projeto está licenciado sob a licença MIT.