broom
fasst wichtige Informationen zu Modellen in Tidy tibble()
s zusammen. broom
bietet drei Verben, um es bequem zu gestalten, mit Modellobjekten zu interagieren:
tidy()
fasst Informationen zu Modellkomponenten zusammenglance()
meldet Informationen über das gesamte Modellaugment()
fügt einem Datensatz Informationen zu Beobachtungen hinzu Eine detaillierte Einführung finden Sie vignette("broom")
.
broom
Tidies 100+ Modelle aus beliebten Modellierungspaketen und fast allen Modellobjekten im stats
, das mit Basis R. vignette("available-methods")
geliefert wird, listet die Methodenverfügbarkeit auf.
Wenn Sie mit ordentlichen Datenstrukturen nicht vertraut sind und wissen möchten, wie sie Ihr Leben erleichtern können, empfehlen wir dringend, Hadley Wickhams ordentliche Daten zu lesen.
# we recommend installing the entire tidyverse
# modeling set, which includes broom:
install.packages( " tidymodels " )
# alternatively, to install just broom:
install.packages( " broom " )
# to get the development version from GitHub:
install.packages( " pak " )
pak :: pak( " tidymodels/broom " )
Wenn Sie einen Fehler finden, stellen Sie bitte ein minimal reproduzierbares Beispiel in den Problemen ein.
tidy()
produziert eine tibble()
wobei jede Zeile Informationen zu einer wichtigen Komponente des Modells enthält. Für Regressionsmodelle entspricht dies häufig Regressionskoeffizienten. Dies kann nützlich sein, wenn Sie ein Modell inspizieren oder benutzerdefinierte Visualisierungen erstellen möchten.
library( broom )
fit <- lm( Volume ~ Girth + Height , trees )
tidy( fit )
# > # A tibble: 3 x 5
# > term estimate std.error statistic p.value
# > <chr> <dbl> <dbl> <dbl> <dbl>
# > 1 (Intercept) -58.0 8.64 -6.71 2.75e- 7
# > 2 Girth 4.71 0.264 17.8 8.22e-17
# > 3 Height 0.339 0.130 2.61 1.45e- 2
glance()
gibt ein Tibble mit genau einer Reihe von Güte von Fitnessmaßnahmen und verwandten Statistiken zurück. Dies ist nützlich, um nach Modell -Fehlspezifikation zu überprüfen und viele Modelle zu vergleichen.
glance( fit )
# > # A tibble: 1 x 12
# > r.squared adj.r.squared sigma statistic p.value df logLik AIC BIC
# > <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# > 1 0.948 0.944 3.88 255. 1.07e-18 2 -84.5 177. 183.
# > # … with 3 more variables: deviance <dbl>, df.residual <int>, nobs <int>
augment
fügt einem Datensatz Spalten hinzu, das Informationen wie angepasste Werte, Residuen oder Clusterzuweisungen enthält. Alle Spalten, die einem Datensatz hinzugefügt wurden, haben .
Präfix, um zu verhindern, dass vorhandene Spalten überschrieben werden.
augment( fit , data = trees )
# > # A tibble: 31 x 9
# > Girth Height Volume .fitted .resid .std.resid .hat .sigma .cooksd
# > <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# > 1 8.3 70 10.3 4.84 5.46 1.50 0.116 3.79 0.0978
# > 2 8.6 65 10.3 4.55 5.75 1.60 0.147 3.77 0.148
# > 3 8.8 63 10.2 4.82 5.38 1.53 0.177 3.78 0.167
# > 4 10.5 72 16.4 15.9 0.526 0.140 0.0592 3.95 0.000409
# > 5 10.7 81 18.8 19.9 -1.07 -0.294 0.121 3.95 0.00394
# > 6 10.8 83 19.7 21.0 -1.32 -0.370 0.156 3.94 0.00840
# > 7 11 66 15.6 16.2 -0.593 -0.162 0.115 3.95 0.00114
# > 8 11 75 18.2 19.2 -1.05 -0.277 0.0515 3.95 0.00138
# > 9 11.1 80 22.6 21.4 1.19 0.321 0.0920 3.95 0.00348
# > 10 11.2 75 19.9 20.2 -0.288 -0.0759 0.0480 3.95 0.0000968
# > # … with 21 more rows
Wir begrüßen Beiträge aller Art!
Für Fragen und Diskussionen zu Tidymodels -Paketen, Modellierung und maschinellem Lernen veröffentlichen Sie bitte in der positiven Community. Wenn Sie der Meinung sind, dass Sie auf einen Fehler gestoßen sind, senden Sie bitte ein Problem. In jedem Fall lernen Sie, wie Sie einen Reprex erstellen und teilen (ein minimales, reproduzierbares Beispiel), um über Ihren Code klar zu kommunizieren. Weitere Informationen zum Beitrag zu Richtlinien für Tidymodels -Pakete und zum Erhalten von Hilfe.
Wenn Sie noch nie direkt zu einem R -Paket beigetragen haben, ist broom
ein ausgezeichneter Startort. Finden Sie ein Problem mit dem Anfänger -freundlichen Tag und Kommentar, den Sie gerne aufnehmen möchten, und wir helfen Ihnen dabei, loszulegen.
Im Allgemeinen ermutigen wir auch Tippfehler, Fehlerberichte, Fehlerbehebungen und Feature -Anfragen. Feedback zur Klarheit der Dokumentation ist besonders wertvoll!
Wenn Sie daran interessiert sind, ordinierigere Methoden für neue Modellobjekte hinzuzufügen, lesen Sie diesen Artikel auf der Tidymodels -Website.
Wir haben einen Mitwirkendenkodex. Durch die Teilnahme am broom
sind Sie sich einig, sich an seine Bedingungen einzuhalten.