scikit-learn (sklearn) 官方文件中文版
sklearn 0.21.3 中文文檔 | sklearn 0.21.3 中文範例 | sklearn 英文官網 |
介紹
sklearn (scikit-learn) 是基於Python 語言的機器學習工具
- 簡單高效的資料探勘與資料分析工具
- 可供大家在各種環境中重複使用
- 建立在NumPy ,SciPy 和matplotlib 上
- 開源,可商業使用- BSD許可證
組織建構[網站]
- GitHub Pages(國外): https://sklearn.apachecn.org
- Gitee Pages(國內): https://apachecn.gitee.io/sklearn-doc-zh
第三方站長[網站]
其他補充
- 官方Github
- EPUB 下載位址
- ApacheCN 翻譯校對兼職群713436582
下載
Docker
docker pull apachecn0/sklearn-doc-zh
docker run -tid -p :80 apachecn0/sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档
PYPI
pip install sklearn-doc-zh
sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档
NPM
npm install -g sklearn-doc-zh
sklearn-doc-zh
# 访问 http://localhost:{port} 查看文档
目錄
- 安裝scikit-learn
- 使用者指南
- 1. 監督學習
- 1.1. 廣義線性模型
- 1.2. 線性與二次判別分析
- 1.3. 內核嶺回歸
- 1.4. 支援向量機
- 1.5. 隨機梯度下降
- 1.6. 最近鄰
- 1.7. 高斯過程
- 1.8. 交叉分解
- 1.9. 樸素貝葉斯
- 1.10. 決策樹
- 1.11. 集成方法
- 1.12. 多類別和多標籤演算法
- 1.13. 特徵選擇
- 1.14. 半監督式學習
- 1.15. 等式回歸
- 1.16. 機率校準
- 1.17. 神經網路模型(有監督)
- 2. 無監督學習
- 2.1. 高斯混合模型
- 2.2. 流形學習
- 2.3. 聚類
- 2.4. 雙聚類
- 2.5. 分解成分中的訊號(矩陣分解問題)
- 2.6. 協方差估計
- 2.7. 新奇和異常值檢測
- 2.8. 密度估計
- 2.9. 神經網路模型(無監督)
- 3. 模型選擇與評估
- 3.1. 交叉驗證:評估估算器的表現
- 3.2. 調整估計器的超參數
- 3.3. 模型評估: 量化預測的質量
- 3.4. 模型持久化
- 3.5. 驗證曲線: 繪製分數評估模型
- 4. 檢驗
- 5. 資料集轉換
- 5.1. Pipeline(管道)和FeatureUnion(特徵聯合): 合併的評估器
- 5.2. 特徵提取
- 5.3 預處理數據
- 5.4 缺失值插補
- 5.5. 無監督降維
- 5.6. 隨機投影
- 5.7. 內核近似
- 5.8. 成對的矩陣, 類別與核函數
- 5.9. 預測目標(
y
) 的轉換
- 6. 資料集載入工具
- 6.1.通用資料集API
- 6.2. 玩具資料集
- 6.3 真實世界中的資料集
- 6.4. 樣本產生器
- 6.5. 載入其他資料集
- 7. 使用scikit-learn計算
- 7.1. 大規模計算的策略: 更大量的數據
- 7.2. 計算性能
- 7.3. 並行性、資源管理與配置
- 教學
- 使用scikit-learn 介紹機器學習
- 關於科學資料處理的統計學習教程
- 機器學習: scikit-learn 中的設定以及預估對象
- 監督學習:從高維度觀察預測輸出變量
- 模型選擇:選擇估計量及其參數
- 無監督學習: 尋求數據表示
- 把它們放在一起
- 尋求協助
- 處理文字數據
- 選擇正確的評估器(estimator.md)
- 外部資源,視訊和談話
- API 參考
- 常見問題
- 時光軸
歷史版本
- scikit-learn (sklearn) 0.19 官方文件中文版
- scikit-learn (sklearn) 0.18 官方文件中文版
如何編譯使用歷史版本:
- 解壓縮
0.19.x.zip
資料夾 - 將
master/img
的圖片資源, 複製到0.19.x
裡面去 - gitbook 正常編譯過程,可以使用
sh run_website.sh
貢獻指南
為了不斷改進翻譯質量,我們特此啟動了【翻譯、校對、筆記整理活動】,開設了多個校對計畫。貢獻者校對一章之後可以領取千字2~4元的獎勵。進行中的校對活動請見活動清單。更多詳情請洽飛龍(Q562826179,V:wizardforcel)。
DOCX:開放共享科學研究記錄行動倡議
我們積極響應科學研究開源計畫(DOCX)。如今開源不僅僅是開放原始碼,還包括資料集、模型、教程和實驗記錄。我們也在探討其它類別的開源方案和協定。
希望大家了解這個倡議,把這個倡議與自己的興趣點結合,做點力所能及的事情。每個人的微小的貢獻,匯聚在一起就是整個開源生態。
專案負責人
格式: GitHub + QQ
第一期(2017-09-29)
第二期(2019-06-29)
- @N!no:1352899627
- @mahaoyang:992635910
- @loopyme:3322728009
- 飛龍:562826179
- 片刻:529815144
-- 負責人要求: (歡迎一起為sklearn 中文版本
做貢獻)
- 熱愛開源,喜歡裝逼
- 長期使用sklearn(至少0.5年) + 提交Pull Requests>=3
- 能夠有時間及時優化頁面bug 和使用者issues
- 試用期: 2個月
- 歡迎聯絡: 片刻529815144
貢獻者
【0.19.X】貢獻者名單
建議回饋
- 在我們的apachecn/pytorch-doc-zh github 上提issue.
- 寄email到Email:
[email protected]
. - 在我們的QQ群-搜尋: 交流方式中聯絡群組主/管理員即可.
專案協議
- 最近有很多人聯絡我們,關於內容授權問題!
- 開源是指知識應該重在傳播和迭代(而不是禁止別人轉載)
- 不然你TM在GitHub開源,然後又說不能讓轉載,你TM有病吧!
- 禁止商業化,符合協議規範,備註地址來源,重點: 不需要寄電子郵件給我們申請
- ApacheCN 帳號下沒有協定的項目,一律視為CC BY-NC-SA 4.0。
溫馨提示:
- 對於個人想自己copy一份再更新的人
- 我也是有這樣的經歷,但是這種激情維持不了幾個月,就洩氣了!
- 不僅浪費了你的心血,還浪費了更多人看到你的翻譯成果!很可惜!你覺得呢?
- 個人的建議是: fork -> pull requests 到
https://github.com/apachecn/sklearn-doc-zh
- 那為什麼要選擇
ApacheCN
呢? - 因為我們做翻譯這件事是覺得開心和裝逼,比較純粹!
- 你如果喜歡,你可以來參與/甚至負責這個項目,沒有任何學歷和背景的限制
贊助我們