hardhat é um pacote focado no desenvolvedor projetado para facilitar a criação de novos pacotes de modelagem, ao mesmo tempo que promove bons padrões de pacotes de modelagem R, conforme estabelecido pelo conjunto de convenções opinativas para pacotes de modelagem R.
O capacete tem quatro objetivos principais:
Pré-processe dados de maneira fácil, consistente e robusta no momento adequado e no tempo de previsão com mold()
e forge()
.
Forneça uma fonte de verdade para funções comuns de validação de entrada, como verificar se os novos dados no momento da previsão contêm as mesmas colunas necessárias usadas no momento do ajuste.
Fornece funções utilitárias extras para tarefas comuns adicionais, como adicionar colunas de interceptação, padronizar a saída predict()
e extrair informações valiosas de classe e nível de fator dos preditores.
Reimagine a infraestrutura de pré-processamento base R de stats::model.matrix()
e stats::model.frame()
usando as abordagens mais rígidas encontradas em model_matrix()
e model_frame()
.
A ideia é reduzir ao máximo o fardo de criar uma boa interface de modelagem e, em vez disso, deixar o desenvolvedor do pacote se concentrar em escrever a implementação central de seu novo modelo. Isto beneficia não apenas o desenvolvedor, mas também o usuário do pacote de modelagem, pois a padronização permite que os usuários construam um conjunto de “expectativas” em torno do que qualquer função de modelagem deve retornar e como devem interagir com ela.
Você pode instalar a versão lançada do capacete de segurança do CRAN com:
install.packages( " hardhat " )
E a versão de desenvolvimento do GitHub com:
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
Para saber como usar o capacete, confira as vinhetas:
vignette("mold", "hardhat")
: Aprenda como pré-processar dados no momento adequado com mold()
.
vignette("forge", "hardhat")
: Aprenda como pré-processar novos dados no momento da previsão com forge()
.
vignette("package", "hardhat")
: Aprenda como usar mold()
e forge()
para ajudar na criação de um novo pacote de modelagem.
Você também pode assistir Max Kuhn discutir como usar o capacete de segurança para construir um novo pacote de modelagem do zero na conferência XI Jornadas de Usuarios de R aqui.
Este projeto é lançado com um Código de Conduta do Colaborador. Ao contribuir para este projeto, você concorda em cumprir seus termos.
Para perguntas e discussões sobre pacotes tidymodels, modelagem e aprendizado de máquina, poste na comunidade RStudio.
Se você acha que encontrou um bug, envie um problema.
De qualquer forma, aprenda como criar e compartilhar um reprex (um exemplo mínimo e reproduzível) para comunicar claramente sobre seu código.
Confira mais detalhes sobre diretrizes de contribuição para pacotes tidymodels e como obter ajuda.