hardhat es un paquete centrado en desarrolladores diseñado para facilitar la creación de nuevos paquetes de modelado y, al mismo tiempo, promueve buenos estándares de paquetes de modelado R según lo establecido en el conjunto de convenciones obstinadas para paquetes de modelado R.
El casco tiene cuatro objetivos principales:
Preprocese datos de manera fácil, consistente y sólida en el momento adecuado y en el momento de predicción con mold()
y forge()
.
Proporcione una fuente de verdad para funciones de validación de entrada comunes, como verificar si los datos nuevos en el momento de la predicción contienen las mismas columnas requeridas utilizadas en el momento de ajuste.
Proporcione funciones de utilidad adicionales para tareas comunes adicionales, como agregar columnas de intercepción, estandarizar la salida predict()
y extraer información valiosa a nivel de clase y factor de los predictores.
Reimagine la infraestructura de preprocesamiento base de R de stats::model.matrix()
y stats::model.frame()
utilizando los enfoques más estrictos que se encuentran en model_matrix()
y model_frame()
.
La idea es reducir la carga de crear una buena interfaz de modelado tanto como sea posible y, en cambio, dejar que el desarrollador del paquete se concentre en escribir la implementación principal de su nuevo modelo. Esto beneficia no sólo al desarrollador, sino también al usuario del paquete de modelado, ya que la estandarización permite a los usuarios crear un conjunto de "expectativas" sobre lo que debería devolver cualquier función de modelado y cómo deberían interactuar con ella.
Puede instalar la versión publicada del casco de CRAN con:
install.packages( " hardhat " )
Y la versión de desarrollo de GitHub con:
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
Para aprender cómo usar el casco, consulte las viñetas:
vignette("mold", "hardhat")
: aprenda a preprocesar datos en el momento adecuado con mold()
.
vignette("forge", "hardhat")
: aprenda a preprocesar nuevos datos en el momento de la predicción con forge()
.
vignette("package", "hardhat")
: aprenda a utilizar mold()
y forge()
para ayudar a crear un nuevo paquete de modelado.
También puede ver a Max Kuhn discutir cómo usar el casco para construir un nuevo paquete de modelado desde cero en la conferencia XI Jornadas de Usuarios de R aquí.
Este proyecto se publica con un Código de conducta para colaboradores. Al contribuir a este proyecto, usted acepta cumplir con sus términos.
Si tiene preguntas y debates sobre los paquetes de tidymodels, el modelado y el aprendizaje automático, publique en RStudio Community.
Si cree que ha encontrado un error, envíe un problema.
De cualquier manera, aprenda a crear y compartir un reprex (un ejemplo mínimo y reproducible) para comunicar claramente su código.
Consulte más detalles sobre las pautas de contribución para paquetes tidymodels y cómo obtener ayuda.