Hardhat 是一个以开发人员为中心的包,旨在简化新建模包的创建,同时推广良好的 R 建模包标准,如一组固执己见的 R 建模包约定所规定的。
安全帽有四个主要目标:
使用mold()
和forge()
在拟合时间和预测时间轻松、一致且稳健地预处理数据。
为常见输入验证功能提供一种事实来源,例如检查预测时的新数据是否包含拟合时使用的相同所需列。
为其他常见任务提供额外的实用函数,例如添加截距列、标准化predict()
输出以及从预测变量中提取有价值的类和因子级别信息。
使用model_matrix()
和model_frame()
中更严格的方法重新构想stats::model.matrix()
和stats::model.frame()
的基本 R 预处理基础结构。
这个想法是尽可能减轻创建良好建模接口的负担,而是让包开发人员专注于编写新模型的核心实现。这不仅有利于开发人员,也有利于建模包的用户,因为标准化允许用户围绕任何建模函数应返回的内容以及应如何与其交互建立一组“期望”。
您可以使用以下命令安装 CRAN 发布的安全帽版本:
install.packages( " hardhat " )
以及来自 GitHub 的开发版本:
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
要了解如何使用安全帽,请查看小插图:
vignette("mold", "hardhat")
:了解如何在拟合时使用mold()
预处理数据。
vignette("forge", "hardhat")
:了解如何在预测时使用forge()
预处理新数据。
vignette("package", "hardhat")
:学习如何使用mold()
和forge()
来帮助创建新的建模包。
您还可以在此处的 XI Jornadas de Usuarios de R 会议上观看 Max Kuhn 讨论如何使用安全帽从头开始构建新的建模包。
该项目随贡献者行为准则一起发布。通过为该项目做出贡献,您同意遵守其条款。
有关 tidymodels 包、建模和机器学习的问题和讨论,请在 RStudio 社区上发帖。
如果您认为遇到了错误,请提交问题。
无论哪种方式,学习如何创建和共享 reprex(一个最小的、可重现的示例),以清晰地传达您的代码。
查看有关 tidymodels 包贡献指南以及如何获取帮助的更多详细信息。