? Ranked as one of the top data science repositories on GitHub!
技術、工具、最佳實踐以及學習機器學習所需的一切!
完整的機器學習套件是一個綜合儲存庫,包含 35 個有關 Python 程式設計、資料操作、資料分析、資料視覺化、資料清理、經典機器學習、電腦視覺和自然語言處理 (NLP) 的筆記本。
所有筆記本都是以讀者為中心而創作的。每個筆記本都從所涵蓋的任何特定演算法/概念的高級概述開始。只要有可能,就會使用視覺效果使事情變得清晰。
2023 年 5 月 10 日:新增了有關 MLOps 的綜合指南。享受指南!
2022 年 6 月 23 日:許多人詢問如何支持該套餐。你可以買杯咖啡☕️
2022 年 5 月 18 日:完整的機器學習套件現已在網路上提供。現在可以輕鬆查看所有筆記本!
2022 年 4 月 9 日:使用預訓練卷積神經網路更新了遷移學習,增加了更多內容並增加了更多資源。
2021 年 11 月 25 日:更新了機器學習基礎:新增了介紹性註釋、ML 系統設計工作流程和學習系統的挑戰。
以下是完整機器學習包中涵蓋的工具。它們是大多數機器學習工程師和資料科學家日常所需的熱門工具。
Python 是一種高階程式語言,在資料社群中很受歡迎,隨著函式庫和框架的快速增長,這是一種適合進行機器學習的程式語言。
NumPy 是一種用於陣列或矩陣運算的科學計算工具。
Pandas 是一個偉大而簡單的工具,用於分析和操作來自各種不同來源的數據。
Matplotlib 是一個綜合性的資料視覺化工具,用於在 Python 中建立靜態、動畫和互動式視覺化。
Seaborn 是另一個基於 Matplotlib 建構的資料視覺化工具,使用起來非常簡單。
Scikit-Learn:Scikit-Learn 無需從頭開始建立機器學習模型,而是可以透過幾行程式碼輕鬆使用經典模型。從新創公司到大型科技公司,幾乎整個機器學習社群和產業都採用了該工具。
用於深度學習的 TensorFlow 和 Keras:TensorFlow 是一種流行的深度學習框架,用於建立適合電腦視覺和自然語言處理等不同領域的模型。 Keras 是一個高階神經網路 API,可以輕鬆設計深度學習模型。 TensorFlow 和 Keras 擁有出色的社區和生態系統,包括 TensorBoard、TF Datasets、TensorFlow Lite、TensorFlow Extended、TensorFlow Hub、TensorFlow.js、TensorFlow GNN 等工具。
[您可以在這裡找到有關 NumPy 的詳細註釋]
探索性資料分析
資料準備簡介
處理分類特徵
特徵縮放
處理缺失值
機器學習 Scikit-Learn 簡介
迴歸的線性模型
用於分類的線性模型
支援向量機:介紹與迴歸
用於分類的支援向量機
決策樹:介紹與回歸
分類決策樹
隨機森林:介紹與迴歸
用於分類的隨機森林
超越隨機森林:更多整合模型
KMeans 聚類無監督學習簡介
主成分分析實用介紹
人工神經網路簡介
為什麼選擇深度學習
單層神經網路
激活函數
深度學習架構的類型
訓練深度神經網路的挑戰
用於深度學習的 TensorFlow 簡介
使用 TensorFlow 進行回歸的神經網絡
使用 TensorFlow 進行分類的神經網絡
卷積神經網路 (CNN) 電腦視覺簡介
用於現實世界資料和影像增強的捲積網絡
使用預訓練卷積神經網路進行遷移學習
[遷移學習的更新筆記本可以在這裡找到]
NLP 與 TensorFlow 文字處理簡介
使用詞嵌入來表示文本
循環神經網路 (RNN)
使用卷積神經網路進行文字分類
使用預先訓練的 BERT 進行文字分類
該存儲庫使用的許多數據集來自以下來源:
機器學習社群非常活躍。完整的機器學習包可以幫助您入門,但這還不夠。幸運的是,有許多精彩的學習資源,其中一些是付費或免費的。這裡列出了許多人經常推薦的課程。請注意,它們並未按使用順序列出。
Coursera 機器學習:本課程由 Andrew Ng 教授。它是最受歡迎的機器學習課程之一,已有超過 400 萬人參加。本課程更著重於機器學習技術和演算法的基礎知識。它在 Coursera 上免費。
深度學習專業化:Andrew Ng. 也指出,深度學習專業化也是一門基礎課程。它教授主要深度學習架構(例如捲積神經網路和循環神經網路)的良好基礎。完整課程可以在 Coursera 上旁聽,或在 Youtube 上免費觀看。
麻省理工學院深度學習簡介:本課程在相當短的時間內提供深度學習的基礎。每堂課的時間不超過一小時,但教材仍然是課堂上最好的。在此處查看課程頁面,在此處查看講座影片。
麻省理工學院以數據為中心的人工智慧簡介:這是有史以來第一個關於 DCAI 的課程。本課程涵蓋用於尋找和解決機器學習資料中常見問題以及建立更好的資料集的演算法,重點關注分類等監督學習任務中使用的資料。本課程教授的所有材料都非常實用,重點關注現實世界中機器學習應用的有影響力的方面,而不是特定模型如何運作的數學細節。您可以參加本課程來學習大多數 ML 課程中未涵蓋的實用技術,這將有助於緩解困擾許多現實世界 ML 應用程式的「垃圾輸入,垃圾輸出」問題。在此處查看課程頁面,在此處查看講座視頻,在此處查看實驗室作業。
紐約大學深度學習 2021 年春季課程:由 Yann LeCun、Alfredo Canziani 在紐約大學講授,本課程是最具創意的課程之一。這些材料以令人驚奇的方式呈現。在此處查看講座視頻,在此處查看課程存儲庫。
CS231N:史丹佛大學的用於視覺識別的捲積神經網路:CS231N 是最好的深度學習和電腦視覺課程之一。 2017 年版本由李飛飛、Justin Johnson 和 Serena Yeung 授課。 2016 年版本由 Fei-Fei、Johnson 和 Andrej Karpathy 授課。請在此處查看 2017 年講座視頻,在此處查看其他資料。
CS224N:史丹佛大學的深度學習自然語言處理:如果您對自然語言處理感興趣,這是一門很棒的課程。它由世界級 NLP 明星之一 Christopher Manning 教授。請參閱此處的講座影片。
fast.ai 的 Practical Deep Learning for Coders :這也是一門密集深度學習課程,涵蓋了深度學習架構和技術的全部範圍。講座影片和筆記本等其他資源是課程頁面。
生產機器學習工程 (MLOps) 專業:由 Andrew Ng.、Laurence Moroney 和 Robert Crowe 教授,這是最好的 ML 工程課程之一。它教授如何設計端到端機器學習生產系統、建立高效的數據和建模管道以及在生產中部署模型。您可以在 Coursera 上找到課程,並在 Github 上找到其他課程資料。
全端深度學習:雖然大多數機器學習課程側重於建模,但本課程側重於運輸機器學習系統。它教授如何設計機器學習專案、資料管理(儲存、存取、處理、版本控制和標籤)、培訓、調試和部署機器學習模型。請參閱此處的 2021 版本和此處的 2019 版本。您也可以瀏覽專案展示,透過學習者專案了解課程成果的類型。
以下是一些很棒的機器學習書籍。
《百頁機器學習書》 :由 Andriy Burkov 撰寫,這是您在網路上找到的最短但簡潔且寫得很好的書之一。您可以在這裡免費閱讀這本書。
機器學習工程:這也是由Andriy Burkov 撰寫的,這是另一本很棒的機器學習書籍,它揭示了機器學習工作流程的每一步,從數據收集、準備......到模型服務和維護。這本書在這裡也是免費的。
機器學習嚮往:由 Andrew Ng. 撰寫,這本書包含建立有效學習系統的各種策略。它被分成小部分,這使得它易於閱讀,並且對於機器學習工程師來說並不困難。任何與資料科學和機器學習團隊合作的人都會發現這本書很有幫助。官方書籍可以在這裡免費獲得,但您可以在這裡閱讀或下載,無需註冊。
Hands-on Machine Learning with Scikit-Learn、Keras 和 TensorFlow :由 Aurelion Geron 撰寫,這是最好的機器學習書籍之一。它寫得很清楚,充滿了想法和最佳實踐。您可以在此處取得該書,或在此處查看其儲存庫。
深度學習:由 3 位深度學習傳奇人物 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 撰寫,這是免費提供的優秀深度學習書籍之一。你可以在這裡得到它。
Deep Learning with Python :由 Keras 設計師 Francois Chollet 撰寫,這是一本非常全面的深度學習書籍。您可以在此處取得該書,並在此處取得該書的儲存庫。
Dive into Deep Learning :這也是一本很棒的深度學習書籍,可以免費取得。本書同時使用 PyTorch 和 TensorFlow。您可以在這裡閱讀整本書。
神經網路與深度學習:這也是邁克爾尼爾森撰寫的另一本很棒的深度學習線上書籍。您可以在這裡閱讀整本書。
如果您對更多機器學習和深度學習資源感興趣,可以在這裡、這裡和這裡找到它們
@article{Nyandwi2021MLPackage,
title = "Complete Machine Learning Package",
author = "Nyandwi, Jean de Dieu",
journal = "GitHub",
year = "2021",
url = "https://nyandwi.com/machine_learning_complete",
}
該存儲庫由 Jean de Dieu Nyandwi 創建。您可以在 Twitter、LinkedIn、Medium 和 Instagram 上找到他。