Hardhat ist ein entwicklerorientiertes Paket, das die Erstellung neuer Modellierungspakete erleichtern und gleichzeitig gute Standards für R-Modellierungspakete fördern soll, wie sie in der Reihe der eigenwilligen Konventionen für R-Modellierungspakete festgelegt sind.
Hardhat hat vier Hauptziele:
Einfache, konsistente und robuste Vorverarbeitung von Daten zum Zeitpunkt der Anpassung und Vorhersage mit mold()
und forge()
.
Stellen Sie eine Quelle der Wahrheit für gängige Eingabevalidierungsfunktionen bereit, z. B. um zu prüfen, ob neue Daten zum Vorhersagezeitpunkt dieselben erforderlichen Spalten enthalten, die zum Anpassungszeitpunkt verwendet wurden.
Stellen Sie zusätzliche Hilfsfunktionen für weitere häufige Aufgaben bereit, z. B. das Hinzufügen von Intercept-Spalten, die Standardisierung predict()
Ausgabe und das Extrahieren wertvoller Informationen auf Klassen- und Faktorebene aus den Prädiktoren.
Stellen Sie sich die Basis-R-Vorverarbeitungsinfrastruktur von stats::model.matrix()
und stats::model.frame()
neu vor, indem Sie die strengeren Ansätze verwenden, die in model_matrix()
und model_frame()
zu finden sind.
Die Idee besteht darin, den Aufwand für die Erstellung einer guten Modellierungsschnittstelle so weit wie möglich zu reduzieren und es dem Paketentwickler stattdessen zu ermöglichen, sich auf das Schreiben der Kernimplementierung seines neuen Modells zu konzentrieren. Dies kommt nicht nur dem Entwickler, sondern auch dem Benutzer des Modellierungspakets zugute, da die Standardisierung es Benutzern ermöglicht, eine Reihe von „Erwartungen“ darüber aufzubauen, was eine Modellierungsfunktion zurückgeben soll und wie sie damit interagieren sollen.
Sie können die veröffentlichte Version von Hardhat von CRAN installieren mit:
install.packages( " hardhat " )
Und die Entwicklungsversion von GitHub mit:
# install.packages("pak")
pak :: pak( " tidymodels/hardhat " )
Um zu erfahren, wie man einen Schutzhelm benutzt, schauen Sie sich die Vignetten an:
vignette("mold", "hardhat")
: Erfahren Sie, wie Sie Daten zum passenden Zeitpunkt mit mold()
vorverarbeiten.
vignette("forge", "hardhat")
: Erfahren Sie, wie Sie mit forge()
neue Daten zum Vorhersagezeitpunkt vorverarbeiten.
vignette("package", "hardhat")
: Erfahren Sie, wie Sie mold()
und forge()
verwenden, um beim Erstellen eines neuen Modellierungspakets zu helfen.
Sie können Max Kuhn auch dabei zusehen, wie er auf der XI Jornadas de Usuarios de R-Konferenz hier darüber spricht, wie man mit einem Helm ein neues Modellierungspaket von Grund auf erstellt.
Dieses Projekt wird mit einem Verhaltenskodex für Mitwirkende veröffentlicht. Indem Sie zu diesem Projekt beitragen, erklären Sie sich mit den Bedingungen einverstanden.
Bei Fragen und Diskussionen zu Tidymodels-Paketen, Modellierung und maschinellem Lernen posten Sie bitte in der RStudio-Community.
Wenn Sie glauben, dass ein Fehler aufgetreten ist, senden Sie bitte ein Problem.
Erfahren Sie in jedem Fall, wie Sie einen Reprex (ein minimales, reproduzierbares Beispiel) erstellen und freigeben, um klar über Ihren Code zu kommunizieren.
Sehen Sie sich weitere Details zu den Beitragsrichtlinien für Tidymodels-Pakete an und erfahren Sie, wie Sie Hilfe erhalten.