Siraj Raval 提出的 100 天機器學習編碼
從這裡獲取數據集
從這裡查看程式碼。
從這裡查看程式碼。
從這裡查看程式碼。
今天,我進入 #100DaysOfMLCode,更深入地了解邏輯回歸到底是什麼以及其背後涉及的數學原理。了解如何計算成本函數,以及如何將梯度下降演算法應用於成本函數以最小化預測誤差。
由於時間較少,我現在將隔天發布資訊圖表。另外,如果有人想在程式碼文件方面幫助我,並且已經在該領域擁有一些經驗並且了解 github 的 Markdown,請在 LinkedIn 上與我聯繫:)。
在這裡查看程式碼
#100DaysOfMLCode 為了澄清我對邏輯回歸的見解,我在網路上搜尋一些資源或文章,並發現了 Saishruthi Swaminathan 的這篇文章 (https://towardsdatascience.com/logistic-regression-detailed-overview-46c4da4303bc)。
它詳細描述了邏輯回歸。一定要檢查一下。
了解 SVM 是什麼以及如何使用它來解決分類問題。
了解有關 SVM 如何運作以及實作 K-NN 演算法的更多資訊。
實作了K-NN分類演算法。 #100DaysOfMLCode 支援向量機資訊圖表已完成一半。明天會更新。
今天繼續#100DaysOfMLCode,我了解了樸素貝葉斯分類器。我還使用 scikit-learn 在 python 中實作 SVM。很快就會更新程式碼。
今天我在線性相關的資料上實作了SVM。使用 Scikit-Learn 函式庫。在 Scikit-Learn 中,我們有 SVC 分類器,用於實現此任務。將在下一個實作中使用 kernel-trick。檢查這裡的程式碼。
了解不同類型的樸素貝葉斯分類器。也開始了彭博社的講座。播放清單中的第一個是黑盒機器學習。它全面概述了預測函數、特徵提取、學習演算法、性能評估、交叉驗證、樣本偏差、非平穩性、過度擬合和超參數調整。
使用 Scikit-Learn 庫實現了 SVM 演算法以及核函數,將我們的數據點映射到更高的維度以找到最佳超平面。
在一天內完成整個第一週和第二週。將邏輯迴歸學習為神經網路。
完成深度學習專業課程 1。用Python實作了一個神經網路。
開始加州理工學院機器學習課程第 18 課 - CS 156,由 Yaser Abu-Mostafa 教授教授。這基本上是對即將到來的講座的介紹。他還解釋了感知器演算法。
完成了改進深度神經網路的第一週:超參數調整、正則化和優化。
觀看了一些有關如何使用 Beautiful Soup 進行網頁抓取的教程,以便收集用於建立模型的資料。
加州理工學院機器學習課程 - CS 156 第 18 講,由 Yaser Abu-Mostafa 教授講授。了解霍夫丁不等式。
Bloomberg ML 課程的 Lec 3 介紹了一些核心概念,如輸入空間、動作空間、結果空間、預測函數、損失函數和假設空間。
檢查這裡的程式碼。
在 youtube 3Blue1Brown 上發現了一個很棒的頻道。它有一個名為“線性代數本質”的播放清單。首先完成 4 個視頻,完整概述了向量、線性組合、跨度、基底向量、線性變換和矩陣乘法。
此處連結到播放清單。
繼續播放列表,完成接下來的 4 個視頻,討論主題 3D 變換、行列式、逆矩陣、列空間、零空間和非方矩陣。
此處連結到播放清單。
在 3Blue1Brown 的播放清單中,完成了另外 3 個線性代數精髓的影片。涵蓋的主題是點積和叉積。
此處連結到播放清單。
今天完成了整個播放列表,影片 12-14。確實是一個令人驚嘆的播放列表,可以刷新線性代數的概念。涵蓋的主題包括基底的變化、特徵向量和特徵值以及抽象向量空間。
此處連結到播放清單。
正在完成 3blue1brown 的播放清單 - 線性代數本質,YouTube 上又彈出了關於同一頻道 3Blue1Brown 的一系列影片的建議。之前的線性代數系列給我留下了深刻的印象,我直接進入了它。完成了大約 5 個視頻,主題包括導數、鍊式法則、乘積法則和指數導數等。
此處連結到播放清單。
觀看了播放清單 Essence of Calculus 中關於隱式微分和極限主題的 2 個影片。
此處連結到播放清單。
觀看了剩餘 4 個視頻,涵蓋積分和高階導數等主題。
此處連結到播放清單。
檢查這裡的程式碼。
3Blue1Brown youtube 頻道提供的神經網路的精彩影片。該影片很好地理解了神經網絡,並使用手寫數位資料集來解釋該概念。連結到影片。
3Blue1Brown youtube 頻道的神經網路第二部分。該影片以有趣的方式解釋了梯度下降的概念。 169必看,強烈推薦。連結到影片。
3Blue1Brown youtube 頻道的神經網路第三部分。影片主要討論偏導數和反向傳播。連結到影片。
3Blue1Brown youtube 頻道的神經網路第四部分。這裡的目標是用更正式的術語來表達反向傳播如何運作的直覺,而影片大部分討論了偏導數和反向傳播。連結到影片。
連結到影片。
連結到影片。
連結到影片。
連結到影片。
轉向無監督學習並研究聚類。在我的網站上查看avikjain.me 還發現了一個精彩的動畫,可以幫助輕鬆理解 K - 均值聚類鏈接
實作了 K 均值聚類。檢查這裡的程式碼。
得到了 JK VanderPlas 的新書《Python Data Science HandBook》,請在此處查看 Jupyter 筆記本。
從第 2 章:Numpy 簡介開始。涵蓋的主題包括資料類型、Numpy 數組和 Numpy 數組上的計算。
檢查代碼 -
NumPy 簡介
了解 Python 中的資料類型
NumPy 數組的基礎知識
NumPy 陣列的計算:通用函數
第 2 章:聚合、比較與廣播
筆記本連結:
聚合:最小值、最大值以及介於兩者之間的所有值
數組計算:廣播
比較、遮罩和布林邏輯
第 2 章:花式索引、陣列排序、結構化數據
筆記本連結:
花式索引
數組排序
結構化資料:NumPy 的結構化數組
第 3 章:使用 Pandas 進行資料操作
涵蓋各種主題,如 Pandas 物件、資料索引和選擇、資料操作、處理遺失資料、分層索引、ConCat 和 Append。
筆記本連結:
使用 Pandas 進行資料操作
介紹 Pandas 對象
數據索引和選擇
對 Pandas 中的數據進行操作
處理缺失資料
分層索引
組合資料集:Concat 和 Append
第 3 章:完成以下主題 - 合併和連結、聚合和分組以及資料透視表。
組合資料集:合併和連接
聚合和分組
數據透視表
第 3 章:向量化字串運算,使用時間序列
筆記本連結:
向量化字串運算
使用時間序列
高性能 Pandas:eval() 和 query()
第 4 章:使用 Matplotlib 進行視覺化了解了簡單線圖、簡單散點圖以及密度和等值線圖。
筆記本連結:
使用 Matplotlib 進行視覺化
簡單線圖
簡單散點圖
可視化錯誤
密度圖和等高線圖
第 4 章:使用 Matplotlib 進行視覺化了解了直方圖、如何自訂圖例、色條以及建立多個子圖。
筆記本連結:
直方圖、分箱和密度
自訂情節圖例
自訂色條
多個子圖
文字和註釋
第 4 章:介紹 Mathplotlib 中的三維繪圖。
筆記本連結:
Matplotlib 中的三維繪圖
研究了層次聚類。看看這個驚人的視覺化。