Created by 唐宇迪
整理這個項目的初衷是方便同學們快速開啟人工智能自學計劃,在學習過程中少走彎路用最快的效率入門Ai並開始實戰項目, 提供了近200個Ai實戰案例和項目,這些並不是網上蒐集來的,而是我這五年線上線下教學所發展和累積的案例。可以說都是反覆迭代更新出來的,適合同學來進行循序漸進的學習與練手。來的同學記得點個star收藏下!
19年底我出版了機器學習課程的配套教材《跟著迪哥學Python資料分析與機器學習實戰》, 風格依舊是通俗易懂,歷時兩年反覆修改訂正十餘次終於和大家見面了。 為了方便更多同學能快速開始學習計劃,我決定將本書的電子版免費送給大家。希望它能為大家帶來學習的收穫! 本專案首頁即可下載PDF版本,教材若喜歡也可向京東購買。
《跟著迪哥學Python資料分析與機器學習實戰》PDF原版下載:
(網盤連結: https://pan.baidu.com/s/19wzJeyPmwTBDp9ASEWBvFQ 提取碼: tece )
下面目錄也就是學習路線路了,初學者建議按照目錄中給的順序來進行學習,已經入門的同學就可以按照自己的喜好來選擇了。
案例中涉及的數據都是真實數據集,有些會比較龐大,直接上傳github大家下載起來會非常慢,我會逐漸上傳各個模組的網盤鏈接,裡麵包括了數據,代碼,PPT等學習資源。如需配套影片解說請新增微信:digexiaozhushou(迪哥小助手拼音)
有各方面合作交流以及專案問題都可以直接加入微信:digexiaozhushou(迪哥小助手拼音)
要學人工智慧(資料科學)這行還是需要一些基本功的,最基礎也是最核心的就是Python和數學了!這兩兄弟入門起來並不難,先掌握基礎的邊用邊學也是可以的!
如果對Python不熟悉的同學們,建議先看一下我的Python入門影片課程,可以快速入門!傳送門
最直接的解釋就是大家都用它!以前是物件導向編程,後來大家更喜歡面向複製貼上編程,現在懶得面對github編程,確實如此,該偷懶就得偷懶,Python就是這個作用! 後續所有的實戰內容都是基於Python,所以沒選!
Anaconda就夠了! Anaconda就夠了! Anaconda就夠了!好了,說了三次了,具體解釋大家參考上面傳送門課程就好
工具包就是人家把功能都寫好了,咱們直接呼叫就完事啦!資料處理,分析,建模等都有對應的工具包。對於學習來說並不用把這些工具包背下來,先熟悉起來,後續肯定還是要現用現查的。
工具包名稱 | 功能概述 |
---|---|
Numpy | 矩陣計算必備!它是後續一切計算的核心,而數據科學領域核心工具包 |
Pandas | 數據處理必備!讀數據,處理數據,分析數據,非他不可! |
Matplotlib | 可視化必備!功能十分強大,沒有畫不出來的圖,分析展示就靠它了! |
Seaborn | 更簡單的可視化神器!一行程式碼給你搞定一個視覺化展示結果 |
數學有多重要同學肯定都十分清楚,尤其是在人工智慧(數據科學)領域,不懂數學想必寸步難行,很多同學都問過我一個問題,工作中真能用上這麼多數學嗎? 我跟大家來解釋一下,人工智慧這行發展相當迅速,在實際工作中肯定要邊幹邊學,學什麼呢?想必就是當下的一些優秀論文了,如果連基本的數學公式都看不懂, 那就不用再談什麼高端技術了。做這行的同學們一定都會有這樣一個想法,所謂的人工智慧就是對數據做各種各樣的數學計算罷了!
對於數學我覺得不需要從頭開始花大量時間一步一個腳印去學習,舉一個例子,我和我身邊的同事,朋友都是乾這行蠻久的了,數學不知道擼了多少遍了,考研時候也曾刷題無數, 但也會遇到這樣的問題,很多知識點如果一段時間沒看很快還是會忘記。我最常做的一件事就是用到什麼查什麼,尋找的過程其實也是學習進步過程。建議大家可以快速過一遍常用的知識點(高數,線性,概率論中的基礎),這個過程中千萬別去看各種解題過程,也不用管具體求解的方法,說白了就是只要理解一個公式是做什麼的,有什麼用就足夠了,類似教材中的習題,練習冊上的求解這些統統不需要,以後也根本不會用筆去算這些麻煩事,把這個時間省下來去學習演算法更劃得來!
知識點 | 內容 | 作用 |
---|---|---|
高等數學 | 高等數學基礎,微積分,泰勒公式與拉格朗日, | 機器學習公式推導必備 |
線性代數 | 線性代數基礎,特徵值與矩陣分解, | 算法求解必備 |
機率論 | 機率論基礎,隨機變數與機率估計,常用分佈 | 機器學習經常提這些詞 |
統計分析 | 迴歸分析,假設檢驗,相關分析,變異數分析 | 數據分析必備 |
人工智慧領域最核心的就是機器學習了,無論大家後續想從事哪個方向,一定都是先從機器學習開始!主要就兩件事, 第一就是掌握經典演算法原理,第二就是熟練應用Python工具包進行建模實戰!
演算法要學什麼? 理解機器學習演算法是如何對資料進行操作從而完成建模求解過程,說穿了就是熟悉下數學在演算法中是如何應用的。重在理解即可!不要對一個問題鑽的沒完沒了,這樣太浪費時間了,沒準後續學習過程中一下子就迎刃而解了。我覺得對演算法的學習肯定不只一遍,尤其是準備面試就業的同學們,二刷,三刷都是很正常的現象(曾經有同學跟我說面試前一共刷了6遍課程)
有了深度學習還需要機器學習嗎?
深度學習可以說是機器學習演算法的一種,並不是有了神經網路其他經典演算法就不需要了,需要根據不同的任務和數據來選擇最合適的演算法,學習路徑肯定是先從機器學習開始,其實掌握了這些經典演算法之後再看神經網路真的很簡單!
知識點 | 內容 | 概述 |
---|---|---|
分類演算法 | 邏輯迴歸,決策樹,支援向量機,整合演算法,貝葉斯演算法 | 準備面試的同學必須掌握 |
回歸演算法 | 線性迴歸,決策樹,整合演算法 | 有些演算法既能做分類也能做回歸 |
聚類演算法 | k-means,dbscan等 | 無監督是實在沒標籤的時候才考慮的 |
降維演算法 | 主成分分析,線性判別分析等 | 重在理解降維的思想 |
進階演算法 | GBDT提升演算法,lightgbm,,EM演算法,隱馬爾科夫模型 | 進階演算法有時間精力的同學可以挑戰 |
透過比較實驗分析經典演算法建模方法及其參數對結果的影響,透過實驗與視覺化展示理解演算法中的參數與應用實例。
案例名稱 | 內容概述 |
---|---|
線性迴歸實驗分析 | 掌握一元與多元線性迴歸,非線性迴歸方法,正規化懲罰的作用 |
模型評估方法 | 常用分類與迴歸演算法評估方法對比,資料集切分實例 |
邏輯迴歸實驗分析 | 經典分類模型建構法,決策樹邊界繪製法 |
聚類演算法實驗分析 | 無監督建模實例,聚類演算法評估方法,無監督的作用與應用實例 |
決策樹實驗分析 | 樹模型視覺化實例與建構方法,樹模型的分類與迴歸應用 |
集成演算法實驗分析 | 整合方法應用實例與效果分析,常見整合策略對比 |
支援向量機實驗分析 | SVM涉及參數與建模比較實驗 |
關聯規則實戰分析 | 關聯規則必備知識點與建模分析實例 |
為了更好地理解演算法的機制從零開始復現經典演算法,堅持不掉包原則,一步步完成演算法所需所有模組。
主要目的是更好的掌握演算法的工作原理,重點在練習!有時間的同學可以自己復現一遍,時間緊迫的同學就不必親力親為了。
案例名稱 | 內容概述 |
---|---|
線性迴歸程式碼實現 | 分模組建構演算法常用函數 |
邏輯回歸程式碼實現 | 實例解讀邏輯迴歸實作方法 |
Kmeans代碼實現 | 非常簡單易懂的無監督演算法 |
決策樹程式碼實現 | 樹模型其實就是遞歸實現 |
神經網路程式碼實現 | 程式碼量略大,建議debug模式學習 |
貝葉斯程式碼實現 | 貝葉斯在文本任務中還是比較好解釋 |
關聯規則代碼實現 | 常用的數據分析演算法 |
打造音樂推薦系統 | 從零開始建構推薦系統模型 |
在實戰中可能把數學知識點都弱化了,因為更多時候我們都是使用現成的工具包來完成任務(調包俠)。這裡需要大家掌握的節能功能比較多, 首先就是熟練使用這些常用工具包了,數據預處理,特徵工程,調參,驗證這些都是非常核心的步驟。概括來說就是要完成不同的任務所需流程和套路都是類似的, 但是使用的方法和演算法卻可能不同,這就需要大家不斷累積來豐富實戰經驗了。給同學們的這些案例大家都可以當作是自己的實戰模板!
最重要的就是學會針對不同數據(數值,文本,圖像)如何進行預處理與分析,熟練應用工具包中各大核心函數進行調參與預處理,針對不同任務提出多種解決方案並進行實驗分析。總結起來就是多做實驗,多動手,程式寫的多了自然就熟練了!
案例名稱 | 內容概述 |
---|---|
K近鄰演算法實戰 | 機器學習入門案例,掌握工具包應用於建模方法 |
交易數據異常檢測 | 十分重要,資料處理與建模策略的詳細分析對比 |
集成演算法建模實戰 | 整合不用我多說了,必備核心策略 |
基於隨機森林的氣溫預測 | 隨機森林是機器學習中最常用的演算法,詳細分析對比 |
新聞分類實戰 | 文字資料分析處理,基於貝葉斯演算法展開建模實戰 |
聚類實踐分析 | 無監督應用實例 |
時間序列分析 | 時間序列資料製作方法,基於序列資料進行建模 |
用戶流失預警 | 我常說夢幻西遊的用戶流失,這個只是個DEMO |
使用lightgbm進行飯店流量預測 | 又是一個大殺器,比xgboost還虎 |
人口普查資料集項目實戰-收入預測 | 核心模板,資料分析,視覺化啥的該有的都有 |
貝葉斯優化實戰 | 難度較大,貝葉斯最佳化工具包使用實例 |
文字特徵方法對比 | 文字資料常用特徵提取方法對比 |
製作自己常用工具包 | 自己做個包玩 |
案例名稱 | 內容概述 |
---|---|
Python實戰關聯規則 | 用工具包來做關聯規則實在太輕鬆了 |
愛彼迎資料集分析與建模 | 房價資料集分析與建模實例 |
基於相似度的飯店推薦系統 | 來建構一個推薦系統完成飯店推薦 |
商品銷售額迴歸分析 | 銷售額預測,很常規的任務,常規套路搞定 |
絕地求生資料集探索分析與建模 | 絕地求生資料集,來看看你究竟被什麼人幹掉了 |
模型解釋方法實戰 | 建模後如何解釋模型呢,這幾個工具包幫你搞定 |
自然語言處理必備工具包實戰 | NLP常用工具包解讀,實例示範 |
銀行客戶還款可能性預測 | 銀行客戶資料來預測還款的可能性 |
影像特徵聚類分析實踐 | 影像資料如何進行聚類呢? |
人口普查資料集項目實戰-收入預測 | 核心模板,資料分析,視覺化啥的該有的都有 |
數據分析這個詞大家每天都在聽,要做什麼?無非是從數據中獲取有價值的信息,這其中方法與套路還是非常多的。 這個方向不需要什麼理論積累,直接上數據,幹就得了!案例的累積就是學習過程!
簡單來說資料探勘就是對海量資料應用機器學習演算法來得到想要的結果。在資料探勘中重點並不是機器學習演算法的選擇,而是怎麼樣處理資料才能得到更好的預測結果,在這裡特徵工程與預處理將成為核心解決方案。
案例名稱 | 內容概述 |
---|---|
泰坦尼克號獲救預測 | 經典的kaggle競賽案例,入門資料探勘的第一個實戰項目 |
資料特徵構建 | 特徵工程是資料探勘的核心,基於sklearn講解多種特徵建構方法 |
用戶畫像實戰 | 使用者畫像想必大家都聽過了,如何應用資料來完成畫像呢? |
整合策略實例 | 在資料探勘中選擇通常都選擇整合策略來更好的提升效果 |
Xgboost實戰 | 整合中的典型代表,競賽的大殺器 |
京東購買意願預測 | 經典預測問題,基於使用者歷史行為資料完成預測任務 |
kaggle數據科學調查 | 視覺化展示kaggle競賽中參賽人員狀況 |
房價預測 | 資料探勘入門等級案例,快速掌握常規套路 |
電力敏感用戶分析 | 競賽實例,主要講解特徵工程的作用 |
fbprophet時間序列預測 | 時間序列預測非常實用的演算法,用起來非常簡單 |
給大家選擇了天池,kaggle,融機等大型競賽案例,並且提供的程式碼和方案均為競賽時優勝者的解決思路。就好比要學下棋就得跟下的最好的玩自己才會提升, 案例中均會講解優勝者的思路和整體解決方案並提供代碼實現。非常有助於大家提升!
案例名稱 | 內容概述 |
---|---|
快手短視訊用戶活躍度分析 | 基於用戶的行為數據來預測接下來的活躍程度 |
工業化工生產預測 | 對化學數據進行分析,建模預測生產效率 |
智慧城市-道路通行時間預測 | 很接地氣的競賽,基於道路資料預測通行時間 |
特徵工程建模可解釋工具包 | 資料探勘中很難的一點就是進行特徵解釋,這些工具包非常實用 |
醫學糖尿病資料命名實體識別 | 命名實體辨識演算法講解與應用實例分析 |
貸款平台風控模型-特徵工程 | 用圖模型來建構特徵工程,這套思路應用很廣 |
新聞關鍵字抽取模型 | 關鍵字抽取可以說是NLP必備技能了 |
機器學習專案實戰模板 | 模板來了,以後有任務可以套用了,方法都差不多 |
電力敏感用戶分析 | 競賽實例,主要講解特徵工程的作用 |
資料探勘主要是建模來進行預測,資料分析則著重在視覺化展示,分析其中各項指標對結果的影響等。給大家選了一些經典分析案例,很多都可以直接當作模板來使用
案例名稱 | 內容概述 |
---|---|
散點圖繪製技巧 | 都說了視覺化才是重點,畫圖肯定必須的了 |
紐約計程車運行狀況分析建模 | 用了很多工具包,可以熟悉下對地理資料如何進行分析與展示 |
基於統計分析的電影推薦任務 | 統計分析常用方法,還能做推薦 |
數據分析與機器學習模板 | 這個模板真的非常全面了,分析,展示,建模,評估,簡直一套龍了 |
資料降維 | 幾種常用的降維演算法比較分析與展示 |
商品視覺化展示與文本處理 | 文字資料預處理與視覺化展示 |
多變量分析 | 多變量分析也是資料分析中常見的方法 |
商品訂單資料集分析 | 訂單資料集分析 |
KIVA貸款數據分析 | 貸款資料集分析 |
深度學習可以說是當下最好用的演算法了,各領域都能吃出來。其實最核心的還是在電腦視覺和自然語言處理中,因為神經網路演算法更適用於圖像和文字資料。 主要要掌握的就是演算法和框架了,演算法就是CNN,RNN這些經典網路模型,框架就是實戰的工具了例如tenorflow,Pytorch等,後面還會詳細說。
好像現在好多朋友一拿到任務,第一個想法都是直接用深度學習做。如果深度學習難度大,做起來麻煩,那還能有這麼高的熱度嗎?其實恰恰相反,我覺得深度學習真的比機器學習簡單很多,在機器學習中需要我們對不同的資料選擇不同的預處理方法和特徵工程建構方法。深度學習中的套路相對來說更固定一些,而且有這些開源框架和各大經典網路架構,我們通常需要做的就是套用就可以了。整體難度要比機器學習任務更容易(只是相對來說!)。
演算法名稱 | 內容概述 |
---|---|
神經網路 | 神經網路是最基礎的,相當於為後面網路的學習打下基礎 |
卷積神經網絡 | 這個大家聽起來很熟悉吧,深度學習中的大哥大!電腦視覺的核心網絡 |
遞歸神經網路 | 北喬峰,南慕容,它就是自然語言處理中的大哥大了! |
對抗生成網絡 | 現在比較火的模型,玩起來很有趣,可以進行各種影像融合 |
序列網路模型 | NLP常用架構,機器學習翻譯模型,應用點比較多 |
各大經典網路架構 | 剛才說的CNN和RNN都是比較基礎的網路模型,在其基礎上還有很多拓展需要大家掌握 |
框架好比說你設計了一個網路模型,但是如果把其中具體的計算過程全部自己完成就太麻煩了。框架提供了高效率的計算方法並且不需要咱們來完成,一套全自動的計算。 相當於我們只需要設計好結構,具體的施工就交給它了。要玩深度學習必備的就是框架了。
tensorflow,Pytorch,keras,caffe等,有這麼多框架,我該選哪一個呢?是不是不同框架差異很大呢? 現在最主流的就是tensorflow和PyTorch了,相當於肯德基和麥當勞吧。都很強,至於具體選擇哪一個還是參考大家各自的專案組和任務需求吧。如果非要我推薦一個我會給大家推薦PyTorch,因為更簡潔通俗。這些框架我全都用過,最主要的原因就是工作中經常需要參考論文和開源項目,一般別人論文中源碼用什麼框架我也就接著進行二次開發了,所以這些框架早晚大家都會用一遍的!
框架沒有什麼理論可談,也不用看各種長篇大論,直接用就得了!其實就是一個工具包,邊用邊學,案例當模板來總結就可以了!
框架名稱 | 內容概述 |
---|---|
Caffe框架 | 古代的神級框架,現在有點跌落神壇了,我學習的第一個框架 |
Tensorflow2版本 | 2版做了很多改進,終於更人性化了,用起來比1版舒服多了 |
Keras | 一句話概述就是簡單!簡單!簡單!都不用學,看程式碼非常容易理解 |
PyTorch | 現階段最火熱的框架,我估計也是今年(2020)最受歡迎的框架了,推薦! |
針對各大深度學習框架皆提供了豐富的實戰案例,用哪個就看大家的喜好了!
谷歌出品我就不用多解釋了,人家谷歌那麼多開源專案肯定都是基於TF框架的,要學習或參考人家開源專案和論文肯定要學TF的,工業界應用也非常廣泛。這波肯定不虧!
案例名稱 | 內容概述 |
---|---|
tensorflow安裝與簡介 | 2版的介紹於安裝方法,簡單過一下就好 |
神經網路原理解讀與整體架構 | 複習下神經網路架構 |
建構神經網路進行分類與迴歸任務 | 用TF完成基本的分類於迴歸任務,掌握其應用方法 |
卷積神經網路原理與參數解讀 | CNN的架構於其中每一個參數詳解 |
貓狗辨識實戰 | 經典的圖像分類任務,這裡要講很多內容,非常重要 |
影像資料增強實例 | 資料增強可以說了現在必備技能了 |
訓練策略-遷移學習實戰 | 遷移學習帶來的效果還是相當可以的 |
遞歸神經網路與詞向量原理解讀 | RNN模型解讀 |
基於TensorFlow實作word2vec | 詞向量模型解讀,並基於TF實現 |
基於RNN模型進行文字分類任務 | 基於TF完成文字分類任務 |
tfrecord製作資料來源 | 資料來源製作實例 |
將CNN網路應用於文字分類實戰 | CNN也能玩文字分類 |
時間序列預測 | 時間序列資料處理與建模實例 |
對抗生成網路實戰 | GAN來啦,這個可好玩了 |
基於CycleGan開源專案實戰影像融合 | 我最喜歡玩的GAN,效果相當逗了! |
經典網路架構Resnet實戰 | 必須懂的網路架構,學就得了! |
19年底Pytorch框架使用人數已經超越tensorflow成為當下最火的框架,原因其實很簡單,大家都喜歡用更簡單易懂的框架。整體的感覺確實比tensorflow好上手而且調試起來十分方便,也是建議初學的同學們優先選擇Pytorch框架。
案例名稱 | 內容概述 |
---|---|
PyTorch框架基本處理操作 | PyTorch簡單熟悉就好,上手非常簡單 |
神經網路實戰分類與迴歸任務 | 用PyTorch建構神經網路模型,確實比TF用的順手 |
卷積神經網路原理與參數解讀 | CNN模型架構與參數書解讀 |
影像辨識核心模組實戰解讀 | 非常重要,PyTorch中的影像處理核心模組 |
遷移學習的作用與應用實例 | PyTorch中載入模型來進行遷移學習 |
遞歸神經網路與詞向量原理解讀 | RNN模型架構解讀 |
新聞資料集文字分類實戰 | 基於PyTorch來建立文本分類模型 |
對抗生成網路架構原理與實戰解析 | GAN模型通俗解讀 |
基於CycleGan開源專案實戰影像融合 | PyTorch版本的CYCLEGAN,這個開源專案寫的相當棒 |
OCR文字辨識原理 | OCR其實原理很簡單,需要多個模型協助完成 |
OCR文字辨識項目實戰 | 建構OCR網路模型 |
基於3D卷積的影片分析與動作識別 | 用3D卷積來處理視訊資料並完成行為識別 |
基於PyTorch實戰BERT模型 | BERT這個架構太火了,必備模型之一 |
PyTorch框架實戰模板解讀 | 提供一個模板,以後有任務可以基於模板來改進 |
整體感覺就是啥都不用學,從案例開始直接用就好了,TF2版本其實跟keras很像。適合做實驗寫論文,簡單快速!
案例名稱 | 內容概述 |
---|---|
安裝與簡介 | keras安裝與上手很容易,基於tf來進行 |
建構神經網路模型 | 建立個神經網路模型來試試水 |
再戰卷積神經網絡 | CNN模型建構起來也非常容易 |
LSTM時間序列預測任務 | LSTM模型應用於時間序列任務 |
文本分類實戰 | 文字分類實例 |
多標籤與多重輸出 | 多標籤任務很常見,很有學習價值 |
新聞資料集文字分類實戰 | 基於keras的文本分類任務 |
數據增強 | 資料增強實例解讀 |
對抗生成網絡 | GAN架構,用keras來做更簡單 |
遷移學習與Resnet殘差網絡 | resnet模型大家一定自己玩一遍 |
地址郵編多序列任務 | 文字模型實例 |
seq2seq網路實戰 | 序列網路模型應用還是比較廣的 |
實戰模板總結 | 給大家提供的keras模板,再有任務直接寫就好 |
我覺得現階段已經有tensorflow和pytorch了,暫時輪不到caffe登場了,初學的同學們就不推薦了。或許有些論文和任務還是需要caffe框架,需要的同學自取就好啦!
案例名稱 | 內容概述 |
---|---|
Caffe設定檔解讀 | Caffe框架常用設定檔解讀 |
多種資料集建構方法 | 資料集建構方法,這很重要 |
Caffe常用工具解讀 | 裡面內建了很多小工具,可以快速完成任務 |
人臉偵測實戰 | 基於Caffe框架建立人臉偵測模型 |
人臉關鍵點定位實戰 | 基於Caffe框架完成人臉關鍵點辨識模型 |
電腦視覺這個行業我就不用多說啦,當下最吃香的了。那都需要學什麼呢?最核心的其實就兩個部分,一個是影像處理,另一個是影像建模。所謂的影像處理就是Opencv 那一套啦,這個工具包簡直無敵了,但凡你要用的這裡全能找到。影像建模主要就是用深度學習來完成檢測,辨識等任務。現階段的學習我覺得關於傳統影像處理演算法可以都不用去看啦,簡單熟悉一下就好,主流的方向還是用深度學習來做,這就需要大家多多最新的閱讀論文了。
建議大家選擇Python版本來進行學習和使用,跟其他工具包一樣,調就完事了!遇到不熟悉的多查API,邊用邊學是最快的途徑。 Opencv中基本所有函數都涉及非常多的數學公式,這些大家都可以先放一放,如果把每個算法每個公式都學一遍那得猴年馬月了,以後用到了再說完全來得及。
為大家準備了非常多的學習資源和案例,前期只需要熟悉即可,工具包就是用的,面向複製貼上程式設計也是一項技能!
案例名稱 | 內容概述 |
---|---|
Opencv簡介與環境配置 | 環境安裝與配置 |
影像基本操作 | 用opencv完成基本的影像處理操作,練手! |
閾值與平滑處理 | 最常用的處理操作,幾行程式碼就能搞定 |
影像形態學操作 | 這幾個形態學操作熟悉下即可 |
影像梯度計算 | 影像梯度計算實例 |
邊緣偵測 | 邊緣偵測的應用面非常廣 |
影像金字塔與輪廓檢測 | 輪廓檢測實例,效果還是不錯的 |
直方圖與傅立葉變換 | 熟悉下即可 |
項目實戰-信用卡數位識別 | 動手做一個實戰項目,對信用卡數字進行檢測與識別 |
項目實戰-文件掃描OCR識別 | 掃描文件數據,進行ocr識別 |
圖像特徵-harris | 常用特徵提取方法,演算法簡單熟悉就可以 |
影像特徵-sift | 最老牌的特徵提取方法了,數學還蠻多的 |
案例實戰-全景影像拼接 | 全景攝影大家一定都玩過,怎麼實現的呢? |
專案實戰-停車場車位識別 | 重型項目,從零開始建造停車場車位識別模型 |
項目實戰-答案卡辨識判卷 | 咱們也整一個自動閱卷的玩玩 |
背景建模 | 常規處理方法 |
光流估計 | 簡單熟悉即可 |
Opencv的DNN模組 | 載入訓練好的模型進行識別 |
專案實戰-目標追蹤 | 追蹤的效果還蠻有趣的 |
卷積原理與操作 | 卷積到哪都是核心 |
項目實戰-疲勞偵測 | 基於攝影機偵測疲勞 |
對於準備面試就業的同學們建議都過一遍,裡面的思想都是蠻好的,大部分都是基於論文來進行復現,有時間的同學最好先閱讀一遍論文再開始研究代碼,裡面的代碼量都會相對較大,建議從debug模式入手,一行程式碼一行程式碼來看,我在講解過程中也會進入debug模式給大家逐行講解。
重點推薦Mask-rcnn實戰項目,可以說是電腦視覺中的通用項目,檢測,識別,分割一步全到位了!應用場景非常廣,也適合進行二次開發和改進,如果要寫在簡歷里肯定非它莫屬了,算法原理和源碼都需要大家熟悉,在課程中我會重點講解該項目,並應用到自己的數據任務中!
項目名稱 | 內容概述 |
---|---|
影像風格轉換(style-transfer) | 主要來學習其思想,效果還是很有趣的 |
影像缺失自動補全 | GAN網路應用場景非常多,影像也能自行修復 |
超解析度重構 | 近年來研究的重點領域之一,這篇論文的效果已經非常好了 |
物體檢測框架-MaskRcnn項目 | 這個就是我重點強調的開源項目,必看!必看!必看! |
MaskRcnn網路框架源碼詳解 | 原始碼非常重要,每一行都需要懂! |
基於MASK-RCNN框架訓練自己的數據 | 如何標註圖像資料並進行訓練呢?這裡給你答案 |
人體姿態辨識demo | MaskRcnn應用場景非常多 |
物件檢測FasterRcnn系列 | 物體偵測的經典之作,可以當作學習資源 |
基於CycleGan開源專案實戰影像融合 | PyTorch版本的CYCLEGAN,這個開源專案寫的相當棒 |
OCR文字辨識原理 | OCR其實原理很簡單,需要多個模型協助完成 |
OCR文字辨識項目實戰 | 建構OCR網路模型 |
基於3D卷積的影片分析與動作識別 | 用3D卷積來處理視訊資料並完成行為識別 |
難度可以說還蠻大的,對影像來說,數據都是固定的,拍了什麼就是什麼!但是文字資料就沒那麼固定了,人類有時候理解起來都不容易,更何況是電腦了。高挑戰也是高收益,NLP發展前景還是非常好的,至於具體選擇哪個方向其實還是看大家的喜好了!
18年的時候谷歌一篇論文橫空出世,BERT!相當於自然語言處理通用解決框架了,基本上所有任務都能做! 這個需要大家重點來學習,並且可以當作專案寫在履歷裡,可以說是當下NLP必備技能之一囉!
項目名稱 | 內容概述 |
---|---|
語言模型 | 語言模型需要大家熟悉下,後續詞向量的基礎 |
使用Gemsim建構詞向量 | Gensim這個包實在好用! |
基於word2vec的分類任務 | 先用這個例子來理解如何使用詞向量 |
NLP-文字特徵方法對比 | 文字特徵構造方法這麼多,哪一個比較好用呢? |
LSTM情緒分析 | 用這個項目來理解RNN模型所需的輸入長什麼樣子 |
NLP-相似度模型 | 文字相似度計算方法 |
對話機器人 | 基於tensorlfow框架建立一個聊天機器人 |
動手打造自己的輸入法 | 能不能建構一款自己的輸入法呢?幫你搞定! |
機器人寫唐詩 | 看看模型寫出的唐詩咋樣! |
NMT機器翻譯框 | 開源項目,可以進行二次開發 |
地址郵編多序列任務 | 經典文字分類任務 |
自然語言處理通用框架BERT原理 | 這個就是上面說的BERT了,重點!重點!重點! |
谷歌開源專案BERT源碼解讀 | 原始碼非常重要,每一行都需要理解 |
基於BERT的中文情感分析 | 基於開源專案進行模型開發 |
基於BERT的中文命名實體識別 | 基於開源專案進行命名實體識別 |
透過這幾年的線上課程還有線下的企業培訓認識了很多小夥伴,機構和同學們的信任是我繼續更新課程最大的動力。大家認識我基本上都是透過視訊課程,很開心能帶給大家收穫,記得最興奮的就是跟家人分享又有小夥伴收穫offer了。感謝這麼多朋友的支持,加油,你們都是最棒的!