broom
总结了整洁tibble()
s中的模型的关键信息。 broom
提供了三个动词,使与模型对象交互变得方便:
tidy()
总结了有关模型组件的信息glance()
报告有关整个模型的信息augment()
将有关观察结果的信息添加到数据集中有关详细的介绍,请参阅vignette("broom")
。
来自流行的建模软件包的100 broom
模型以及基本R. vignette("available-methods")
随附的stats
包中的几乎所有模型对象列出了方法可用性。
如果您不熟悉整洁的数据结构,并且想知道它们如何使您的生活更轻松,我们强烈建议您阅读Hadley Wickham的整洁数据。
# we recommend installing the entire tidyverse
# modeling set, which includes broom:
install.packages( " tidymodels " )
# alternatively, to install just broom:
install.packages( " broom " )
# to get the development version from GitHub:
install.packages( " pak " )
pak :: pak( " tidymodels/broom " )
如果找到错误,请在问题中提交一个最小可重复的示例。
tidy()
产生一个tibble()
其中每一行包含有关模型重要组成部分的信息。对于回归模型,这通常对应于回归系数。如果要检查模型或创建自定义可视化,这将很有用。
library( broom )
fit <- lm( Volume ~ Girth + Height , trees )
tidy( fit )
# > # A tibble: 3 x 5
# > term estimate std.error statistic p.value
# > <chr> <dbl> <dbl> <dbl> <dbl>
# > 1 (Intercept) -58.0 8.64 -6.71 2.75e- 7
# > 2 Girth 4.71 0.264 17.8 8.22e-17
# > 3 Height 0.339 0.130 2.61 1.45e- 2
glance()
返回具有一排健身措施和相关统计的一排。这对于检查模型错误指定并比较许多型号很有用。
glance( fit )
# > # A tibble: 1 x 12
# > r.squared adj.r.squared sigma statistic p.value df logLik AIC BIC
# > <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# > 1 0.948 0.944 3.88 255. 1.07e-18 2 -84.5 177. 183.
# > # … with 3 more variables: deviance <dbl>, df.residual <int>, nobs <int>
augment
将列添加到数据集中,其中包含拟合值,残差或集群分配等信息。所有添加到数据集中的列.
前缀防止现有列被覆盖。
augment( fit , data = trees )
# > # A tibble: 31 x 9
# > Girth Height Volume .fitted .resid .std.resid .hat .sigma .cooksd
# > <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# > 1 8.3 70 10.3 4.84 5.46 1.50 0.116 3.79 0.0978
# > 2 8.6 65 10.3 4.55 5.75 1.60 0.147 3.77 0.148
# > 3 8.8 63 10.2 4.82 5.38 1.53 0.177 3.78 0.167
# > 4 10.5 72 16.4 15.9 0.526 0.140 0.0592 3.95 0.000409
# > 5 10.7 81 18.8 19.9 -1.07 -0.294 0.121 3.95 0.00394
# > 6 10.8 83 19.7 21.0 -1.32 -0.370 0.156 3.94 0.00840
# > 7 11 66 15.6 16.2 -0.593 -0.162 0.115 3.95 0.00114
# > 8 11 75 18.2 19.2 -1.05 -0.277 0.0515 3.95 0.00138
# > 9 11.1 80 22.6 21.4 1.19 0.321 0.0920 3.95 0.00348
# > 10 11.2 75 19.9 20.2 -0.288 -0.0759 0.0480 3.95 0.0000968
# > # … with 21 more rows
我们欢迎各种类型的贡献!
有关TidyModels软件包,建模和机器学习的问题和讨论,请在Poitit Community上发布。如果您认为遇到了一个错误,请提交问题。无论哪种方式,都要了解如何创建和共享reprex(最小,可重现的示例),以清楚地对您的代码进行交流。查看有关花絮软件包的贡献准则以及如何获得帮助的更多详细信息。
如果您以前从未直接为R套餐做出贡献, broom
是一个很好的起点。找到初学者友好标签的问题,并评论您想接受的问题,我们将帮助您入门。
通常,我们也鼓励打字错误,错误报告,错误修复和功能请求。关于文档的清晰度的反馈特别有价值!
如果您有兴趣添加用于新模型对象的清晰方法,请在TidyModels网站上阅读本文。
我们有贡献者的行为准则。通过参加broom
,您同意遵守其条款。