scikit-learn (sklearn) 官方文档中文版
sklearn 0.21.3 中文文档 |
sklearn 0.21.3 中文示例 |
sklearn 英文官网 |
介绍
sklearn (scikit-learn) 是基于 Python 语言的机器学习工具
- 简单高效的数据挖掘和数据分析工具
- 可供大家在各种环境中重复使用
- 建立在 NumPy ,SciPy 和 matplotlib 上
- 开源,可商业使用 - BSD许可证
组织构建[网站]
- GitHub Pages(国外): https://sklearn.apachecn.org
- Gitee Pages(国内): https://apachecn.gitee.io/sklearn-doc-zh
第三方站长[网站]
其他补充
- 官方Github
- EPUB 下载地址
- ApacheCN 翻译校对兼职群 713436582
下载
Docker
docker pull apachecn0/sklearn-doc-zh
docker run -tid -p :80 apachecn0/sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档
PYPI
pip install sklearn-doc-zh
sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档
NPM
npm install -g sklearn-doc-zh
sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档
目录
- 安装 scikit-learn
- 用户指南
- 1. 监督学习
- 1.1. 广义线性模型
- 1.2. 线性和二次判别分析
- 1.3. 内核岭回归
- 1.4. 支持向量机
- 1.5. 随机梯度下降
- 1.6. 最近邻
- 1.7. 高斯过程
- 1.8. 交叉分解
- 1.9. 朴素贝叶斯
- 1.10. 决策树
- 1.11. 集成方法
- 1.12. 多类和多标签算法
- 1.13. 特征选择
- 1.14. 半监督学习
- 1.15. 等式回归
- 1.16. 概率校准
- 1.17. 神经网络模型(有监督)
- 2. 无监督学习
- 2.1. 高斯混合模型
- 2.2. 流形学习
- 2.3. 聚类
- 2.4. 双聚类
- 2.5. 分解成分中的信号(矩阵分解问题)
- 2.6. 协方差估计
- 2.7. 新奇和异常值检测
- 2.8. 密度估计
- 2.9. 神经网络模型(无监督)
- 3. 模型选择和评估
- 3.1. 交叉验证:评估估算器的表现
- 3.2. 调整估计器的超参数
- 3.3. 模型评估: 量化预测的质量
- 3.4. 模型持久化
- 3.5. 验证曲线: 绘制分数以评估模型
- 4. 检验
- 5. 数据集转换
- 5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
- 5.2. 特征提取
- 5.3 预处理数据
- 5.4 缺失值插补
- 5.5. 无监督降维
- 5.6. 随机投影
- 5.7. 内核近似
- 5.8. 成对的矩阵, 类别和核函数
- 5.9. 预测目标 (
y
) 的转换
- 6. 数据集加载工具
- 6.1. 通用数据集 API
- 6.2. 玩具数据集
- 6.3 真实世界中的数据集
- 6.4. 样本生成器
- 6.5. 加载其他数据集
- 7. 使用scikit-learn计算
- 7.1. 大规模计算的策略: 更大量的数据
- 7.2. 计算性能
- 7.3. 并行性、资源管理和配置
- 教程
- 使用 scikit-learn 介绍机器学习
- 关于科学数据处理的统计学习教程
- 机器学习: scikit-learn 中的设置以及预估对象
- 监督学习:从高维观察预测输出变量
- 模型选择:选择估计量及其参数
- 无监督学习: 寻求数据表示
- 把它们放在一起
- 寻求帮助
- 处理文本数据
- 选择正确的评估器(estimator.md)
- 外部资源,视频和谈话
- API 参考
- 常见问题
- 时光轴
历史版本
- scikit-learn (sklearn) 0.19 官方文档中文版
- scikit-learn (sklearn) 0.18 官方文档中文版
如何编译使用历史版本:
- 解压
0.19.x.zip
文件夹
- 将
master/img
的图片资源, 复制到 0.19.x
里面去
- gitbook 正常编译过程,可以使用
sh run_website.sh
贡献指南
为了不断改进翻译质量,我们特此启动了【翻译、校对、笔记整理活动】,开设了多个校对项目。贡献者校对一章之后可以领取千字2~4元的奖励。进行中的校对活动请见活动列表。更多详情请联系飞龙(Q562826179,V:wizardforcel)。
DOCX:开放共享科研记录行动倡议
我们积极响应科研开源计划(DOCX)。如今开源不仅仅是开放源码,还包括数据集、模型、教程和实验记录。我们也在探讨其它类别的开源方案和协议。
希望大家了解这个倡议,把这个倡议与自己的兴趣点结合,做点力所能及的事情。每个人的微小的贡献,汇聚在一起就是整个开源生态。
项目负责人
格式: GitHub + QQ
第一期 (2017-09-29)
第二期 (2019-06-29)
- @N!no:1352899627
- @mahaoyang:992635910
- @loopyme:3322728009
- 飞龙:562826179
- 片刻:529815144
-- 负责人要求: (欢迎一起为 sklearn 中文版本
做贡献)
- 热爱开源,喜欢装逼
- 长期使用 sklearn(至少0.5年) + 提交Pull Requests>=3
- 能够有时间及时优化页面 bug 和用户 issues
- 试用期: 2个月
- 欢迎联系: 片刻 529815144
贡献者
【0.19.X】贡献者名单
建议反馈
- 在我们的 apachecn/pytorch-doc-zh github 上提 issue.
- 发邮件到 Email:
[email protected]
.
- 在我们的 QQ群-搜索: 交流方式 中联系群主/管理员即可.
项目协议
- 最近有很多人联系我们,关于内容授权问题!
- 开源是指知识应该重在传播和迭代(而不是禁止别人转载)
- 不然你TM在GitHub开源,然后又说不让转载,你TM有病吧!
- 禁止商业化,符合协议规范,备注地址来源,重点: 不需要发邮件给我们申请
- ApacheCN 账号下没有协议的项目,一律视为 CC BY-NC-SA 4.0。
温馨提示:
- 对于个人想自己copy一份再更新的人
- 我也是有这样的经历,但是这种激情维持不了几个月,就泄气了!
- 不仅浪费了你的心血,还浪费了更多人看到你的翻译成果!很可惜!你觉得呢?
- 个人的建议是: fork -> pull requests 到
https://github.com/apachecn/sklearn-doc-zh
- 那为什么要选择
ApacheCN
呢?
- 因为我们做翻译这事情是觉得开心和装逼,比较纯粹!
- 你如果喜欢,你可以来参与/甚至负责这个项目,没有任何学历和背景的限制
赞助我们