Hardhat 是一個以開發人員為中心的包,旨在簡化新建模包的創建,同時推廣良好的 R 建模包標準,如一組固執己見的 R 建模包約定所規定的。
安全帽有四個主要目標:
使用mold()
和forge()
在擬合時間和預測時間輕鬆、一致且穩健地預處理資料。
為常見輸入驗證功能提供一個事實來源,例如檢查預測時的新資料是否包含擬合時使用的相同所需列。
為其他常見任務提供額外的實用函數,例如添加截距列、標準化predict()
輸出以及從預測變數中提取有價值的類別和因子層級資訊。
使用model_matrix()
和model_frame()
中更嚴格的方法重新構想stats::model.matrix()
和stats::model.frame()
的基本 R 預處理基礎架構。
這個想法是盡可能減輕創建良好建模介面的負擔,而是讓套件開發人員專注於編寫新模型的核心實作。這不僅有利於開發人員,也有利於建模包的用戶,因為標準化允許用戶圍繞任何建模函數應返回的內容以及應如何與其互動建立一組「期望」。
您可以使用以下命令安裝 CRAN 發布的安全帽版本:
install.packages( " hardhat " )
以及來自 GitHub 的開發版本:
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
若要了解如何使用安全帽,請查看小插圖:
vignette("mold", "hardhat")
:了解如何在擬合時使用mold()
預處理資料。
vignette("forge", "hardhat")
:了解如何在預測時使用forge()
預處理新資料。
vignette("package", "hardhat")
:學習如何使用mold()
和forge()
來幫助建立新的建模套件。
您還可以在此處的 XI Jornadas de Usuarios de R 會議上觀看 Max Kuhn 討論如何使用安全帽從頭開始建立新的建模包。
該項目隨貢獻者行為準則一起發布。透過為該項目做出貢獻,您同意遵守其條款。
有關 tidymodels 套件、建模和機器學習的問題和討論,請在 RStudio 社群上發佈。
如果您認為遇到了錯誤,請提交問題。
無論哪種方式,學習如何創建和共享 reprex(一個最小的、可重現的範例),以清晰地傳達您的程式碼。
查看有關 tidymodels 包貢獻指南以及如何獲得協助的更多詳細資訊。