以下是這些部分:
本節包含面試中會被問到的資料科學基本概念的備忘單:
本部分包含我讀過的有關資料科學和機器學習的書籍:
本節包含實際資料科學面試中提出的範例問題:
本節包含有關設計機器學習系統以解決實際問題的案例研究問題。
本節包含我出於學術、自學和業餘愛好目的完成的資料科學專案組合。
如需瀏覽作品集時獲得更視覺上愉悅的體驗,請造訪 jameskle.com/data-portfolio
Transfer Rec:我正在進行的研究工作涉及深度學習和推薦系統。
電影推薦:設計了 4 個不同的模型來推薦 MovieLens 資料集上的項目。
工具:PyTorch、TensorBoard、Keras、Pandas、NumPy、SciPy、Matplotlib、Seaborn、Scikit-Learn、Surprise、Wordcloud
行程優化器:使用 XGBoost 和演化演算法來優化紐約市計程車的行程時間。
Instacart 市場購物籃分析:解決了 Instacart 市場購物籃分析挑戰,以預測用戶的下一個訂單中將包含哪些產品。
工具:Pandas、NumPy、Matplotlib、XGBoost、Geopy、Scikit-Learn
時尚推薦:建構了基於ResNet的模型,根據語義相似度對DeepFashion資料庫中的時尚圖像進行分類和推薦。
時尚分類:開發了 4 種不同的捲積神經網絡,對時尚 MNIST 資料集中的圖像進行分類。
狗品種分類:設計了一個辨識狗品種的捲積神經網路。
道路分割:在 Kitty Road 資料集中實現了用於語義分割任務的全卷積網路。
工具:TensorFlow、Keras、Pandas、NumPy、Matplotlib、Scikit-Learn、TensorBoard
2018 年世界盃球隊分析:對 FIFA 18 資料集進行分析和視覺化,以預測 2018 年俄羅斯世界盃 10 支球隊的最佳國際陣容。
Spotify 藝術家分析:對 Spotify 上 50 位不同流派的不同藝術家的音樂風格進行分析和視覺化。
工具:Pandas、NumPy、Matplotlib、Rspotify、httr、dplyr、tidyr、雷達圖、ggplot2
本節包含我為自由職業客戶和自學目的而完成的數據新聞文章組合。
要獲得更視覺上愉悅的瀏覽作品集的體驗,請訪問 jameskle.com/data-journalism
資料科學家需要掌握的 10 項統計技術
邏輯迴歸教程
決策樹教程
支援向量機教程
為商業領袖簡單介紹數據驅動行銷
機器學習工程師需要了解的 10 種演算法
關於機器學習需要了解的 12 件事
機器學習新手十大演算法一覽
資料科學家工具箱所需的 10 種資料探勘技術
電子商務中的聚類與分類
學習排名的基本知識
調試機器學習模型的 6 種方法
當今值得追求的 8 條機器學習職業道路
AI從業人員需要應用的10種深度學習方法
機器學習研究人員需要學習的 8 種神經網路架構
每個認真的機器學習者都應該熟悉的 5 個深度學習框架
改變你看待世界方式的 5 種電腦視覺技術
卷積神經網路:生物學啟發模型
遞歸神經網路:語言建模的動力來源
將改變你未來溝通方式的 7 種 NLP 技術
2018 年主導電腦視覺的 5 個趨勢
為您的裝置提供支援的 3 個端對端語音辨識深度學習框架
在小型裝置上進行高效能深度學習推理的 5 種演算法
更有效訓練深度神經網路模型的 4 種研究技術
用於深度網路高效訓練和推理的兩種硬體架構
2020 年需要牢記的 10 個深度學習最佳實踐
這些 PDF 備忘單來自 BecomingHuman.AI。