hardhat は、新しいモデリング パッケージの作成を容易にすると同時に、一連の独自の R モデリング パッケージ規約によって定められた優れた R モデリング パッケージ標準を促進するように設計された開発者中心のパッケージです。
ヘルメットには 4 つの主な目的があります。
mold()
とforge()
を使用して、フィット時と予測時にデータを簡単、一貫性、堅牢に前処理します。
予測時の新しいデータに、適合時に使用されたものと同じ必要な列が含まれているかどうかを確認するなど、一般的な入力検証関数に対して 1 つの信頼できる情報源を提供します。
切片列の追加、 predict()
出力の標準化、予測子からの貴重なクラスおよび因子レベルの情報の抽出など、追加の一般的なタスク用に追加のユーティリティ関数を提供します。
model_matrix()
とmodel_frame()
にあるより厳密なアプローチを使用して、 stats::model.matrix()
とstats::model.frame()
の基本的な R 前処理インフラストラクチャを再考します。
その考えは、優れたモデリング インターフェイスを作成する負担をできる限り軽減し、代わりにパッケージ開発者が新しいモデルのコア実装の作成に集中できるようにすることです。これは、開発者だけでなく、モデリング パッケージのユーザーにも利益をもたらします。標準化により、ユーザーは、モデリング関数が何を返すか、そしてそれとどのように対話するかを中心に一連の「期待」を構築できるからです。
CRAN からリリースされたバージョンのハードハットをインストールするには、次のコマンドを使用します。
install.packages( " hardhat " )
GitHub からの開発バージョンは次のとおりです。
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
ヘルメットの使用方法については、以下のビネットをご覧ください。
vignette("mold", "hardhat")
: mold()
を使用してフィット時にデータを前処理する方法を学びます。
vignette("forge", "hardhat")
: forge()
を使用して予測時に新しいデータを前処理する方法を学びます。
vignette("package", "hardhat")
: 新しいモデリング パッケージの作成に役立つ、 mold()
とforge()
の使用方法を学びます。
ここで、Max Kuhn が XI Jornadas de Usuarios de R カンファレンスで、ヘルメットを使用して新しいモデリング パッケージをゼロから構築する方法について議論する様子を視聴することもできます。
このプロジェクトは、貢献者の行動規範とともにリリースされています。このプロジェクトに貢献すると、その規約に従うことに同意したことになります。
tinymodels パッケージ、モデリング、機械学習に関する質問やディスカッションについては、RStudio コミュニティに投稿してください。
バグに遭遇したと思われる場合は、問題を送信してください。
いずれにしても、コードについて明確に伝えるために、reprex (最小限の再現可能な例) を作成して共有する方法を学びましょう。
tinymodels パッケージの貢献ガイドラインとヘルプの入手方法に関する詳細を確認してください。