hardhat est un package destiné aux développeurs et conçu pour faciliter la création de nouveaux packages de modélisation, tout en promouvant simultanément de bonnes normes de package de modélisation R, telles que définies par l'ensemble des conventions avisées pour les packages de modélisation R.
Le casque a quatre objectifs principaux :
Prétraitez les données de manière simple, cohérente et robuste au moment de l'ajustement et au moment de la prédiction avec mold()
et forge()
.
Fournissez une source de vérité pour les fonctions de validation d'entrée courantes, telles que vérifier si les nouvelles données au moment de la prédiction contiennent les mêmes colonnes requises que celles utilisées au moment de l'ajustement.
Fournissez des fonctions utilitaires supplémentaires pour des tâches courantes supplémentaires, telles que l'ajout de colonnes d'interception, la normalisation de la sortie predict()
et l'extraction d'informations précieuses au niveau des classes et des facteurs à partir des prédicteurs.
Réinventez l'infrastructure de prétraitement de base R de stats::model.matrix()
et stats::model.frame()
en utilisant les approches plus strictes trouvées dans model_matrix()
et model_frame()
.
L'idée est de réduire autant que possible le fardeau de la création d'une bonne interface de modélisation et de laisser le développeur du package se concentrer sur l'écriture de l'implémentation principale de son nouveau modèle. Cela profite non seulement au développeur, mais également à l'utilisateur du package de modélisation, car la standardisation permet aux utilisateurs de créer un ensemble d'« attentes » autour de ce que toute fonction de modélisation devrait renvoyer et de la manière dont ils doivent interagir avec elle.
Vous pouvez installer la version publiée du casque de CRAN avec :
install.packages( " hardhat " )
Et la version de développement de GitHub avec :
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
Pour en savoir plus sur l'utilisation du casque, consultez les vignettes :
vignette("mold", "hardhat")
: Apprenez à prétraiter les données au moment de l'ajustement avec mold()
.
vignette("forge", "hardhat")
: Apprenez à prétraiter de nouvelles données au moment de la prédiction avec forge()
.
vignette("package", "hardhat")
: Apprenez à utiliser mold()
et forge()
pour vous aider à créer un nouveau package de modélisation.
Vous pouvez également regarder Max Kuhn expliquer comment utiliser Hardhat pour créer un nouveau package de modélisation à partir de zéro lors de la XIe conférence Jornadas de Usuarios de R ici.
Ce projet est publié avec un code de conduite des contributeurs. En contribuant à ce projet, vous acceptez d'en respecter les termes.
Pour des questions et des discussions sur les packages Tidymodels, la modélisation et l'apprentissage automatique, veuillez publier sur la communauté RStudio.
Si vous pensez avoir rencontré un bug, veuillez soumettre un problème.
Quoi qu’il en soit, apprenez à créer et partager un reprex (un exemple minimal et reproductible), pour communiquer clairement sur votre code.
Consultez plus de détails sur les directives de contribution pour les packages Tidymodels et comment obtenir de l'aide.