broom
總結了整潔tibble()
s中的模型的關鍵信息。 broom
提供了三個動詞,使與模型對象交互變得方便:
tidy()
總結了有關模型組件的信息glance()
報告有關整個模型的信息augment()
將有關觀察結果的信息添加到數據集中有關詳細的介紹,請參閱vignette("broom")
。
來自流行的建模軟件包的100 broom
模型以及基本R. vignette("available-methods")
隨附的stats
包中的幾乎所有模型對象列出了方法可用性。
如果您不熟悉整潔的數據結構,並且想知道它們如何使您的生活更輕鬆,我們強烈建議您閱讀Hadley Wickham的整潔數據。
# we recommend installing the entire tidyverse
# modeling set, which includes broom:
install.packages( " tidymodels " )
# alternatively, to install just broom:
install.packages( " broom " )
# to get the development version from GitHub:
install.packages( " pak " )
pak :: pak( " tidymodels/broom " )
如果找到錯誤,請在問題中提交一個最小可重複的示例。
tidy()
產生一個tibble()
其中每一行包含有關模型重要組成部分的信息。對於回歸模型,這通常對應於回歸係數。如果要檢查模型或創建自定義可視化,這將很有用。
library( broom )
fit <- lm( Volume ~ Girth + Height , trees )
tidy( fit )
# > # A tibble: 3 x 5
# > term estimate std.error statistic p.value
# > <chr> <dbl> <dbl> <dbl> <dbl>
# > 1 (Intercept) -58.0 8.64 -6.71 2.75e- 7
# > 2 Girth 4.71 0.264 17.8 8.22e-17
# > 3 Height 0.339 0.130 2.61 1.45e- 2
glance()
返回具有一排健身措施和相關統計的一排。這對於檢查模型錯誤指定並比較許多型號很有用。
glance( fit )
# > # A tibble: 1 x 12
# > r.squared adj.r.squared sigma statistic p.value df logLik AIC BIC
# > <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# > 1 0.948 0.944 3.88 255. 1.07e-18 2 -84.5 177. 183.
# > # … with 3 more variables: deviance <dbl>, df.residual <int>, nobs <int>
augment
將列添加到數據集中,其中包含擬合值,殘差或集群分配等信息。所有添加到數據集中的列.
前綴防止現有列被覆蓋。
augment( fit , data = trees )
# > # A tibble: 31 x 9
# > Girth Height Volume .fitted .resid .std.resid .hat .sigma .cooksd
# > <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# > 1 8.3 70 10.3 4.84 5.46 1.50 0.116 3.79 0.0978
# > 2 8.6 65 10.3 4.55 5.75 1.60 0.147 3.77 0.148
# > 3 8.8 63 10.2 4.82 5.38 1.53 0.177 3.78 0.167
# > 4 10.5 72 16.4 15.9 0.526 0.140 0.0592 3.95 0.000409
# > 5 10.7 81 18.8 19.9 -1.07 -0.294 0.121 3.95 0.00394
# > 6 10.8 83 19.7 21.0 -1.32 -0.370 0.156 3.94 0.00840
# > 7 11 66 15.6 16.2 -0.593 -0.162 0.115 3.95 0.00114
# > 8 11 75 18.2 19.2 -1.05 -0.277 0.0515 3.95 0.00138
# > 9 11.1 80 22.6 21.4 1.19 0.321 0.0920 3.95 0.00348
# > 10 11.2 75 19.9 20.2 -0.288 -0.0759 0.0480 3.95 0.0000968
# > # … with 21 more rows
我們歡迎各種類型的貢獻!
有關TidyModels軟件包,建模和機器學習的問題和討論,請在Poitit Community上發布。如果您認為遇到了一個錯誤,請提交問題。無論哪種方式,都要了解如何創建和共享reprex(最小,可重現的示例),以清楚地對您的代碼進行交流。查看有關花絮軟件包的貢獻準則以及如何獲得幫助的更多詳細信息。
如果您以前從未直接為R套餐做出貢獻, broom
是一個很好的起點。找到初學者友好標籤的問題,並評論您想接受的問題,我們將幫助您入門。
通常,我們也鼓勵打字錯誤,錯誤報告,錯誤修復和功能請求。關於文檔的清晰度的反饋特別有價值!
如果您有興趣添加用於新模型對象的清晰方法,請在TidyModels網站上閱讀本文。
我們有貢獻者的行為準則。通過參加broom
,您同意遵守其條款。