人工智慧系統學院
???機器學習系統、LLM(大型語言模型)、GenAI(生成式人工智慧)
更新:
- 影片教學 [YouTube] [bilibili] [小紅書]
- 我們正在為此倉庫準備一個新網站 [Lets Go AI]!
人工智慧系統之路【必讀白皮書】
機器學習系統研究的精選清單。程式碼連結(如果可用)也存在。現在我們有一個團隊來維護這個專案。非常歡迎您使用我們的範本提出拉取請求。
人工智慧系統(按類別排序)
ML / DL 基礎設施
法學碩士基礎設施
特定領域的基礎設施
- 視訊系統
- 自動機器學習系統
- 邊緣人工智慧
- 神經網路系統
- 聯邦學習系統
- 深度強化學習系統
ML/LLM會議系統
會議
- 開放式資料介面
- SOSP
- 訊號通訊
- 國家統計局
- ML系統
- 空中交通管制
- 歐洲系統公司
- 中介軟體
- 系統晶片
- 小機器學習
一般資源
民調
- 邁向高可用性、智慧雲端和機器學習系統 [幻燈片]
- 分散式運算(又稱大數據)的精彩系統設計文章、影片和資源的精選清單。 [GitHub]
- Awesome-product-machine-learning:用於部署、監控、版本控制和擴展機器學習的優秀開源庫的精選清單 [GitHub]
- 機器學習加速器在生產上的機會與挑戰 [論文]
- Ananthanarayanan、Rajagopal 等人。 」
- 2019 {USENIX} 操作機器學習會議 (OpML 19)。 2019.
- 如何(以及如何不)寫一篇好的系統論文[建議]
- Facebook 的應用機器學習:資料中心基礎設施觀點 [論文]
- 黑澤爾伍德,金,等人。 ( HPCA 2018 )
- 可用機器學習的基礎設施:史丹佛 DAWN 項目
- 彼得·巴利斯、昆勒·奧盧科頓、克里斯多福·雷和馬泰·扎哈里亞。 ( 2017 年預印本)
- 機器學習系統中隱藏的技術債 [論文]
- 斯卡利、大衛等人。 (國家資訊處理計劃 2015 )
- 系統設計中的端到端論證[論文]
- 傑羅姆·H·薩爾澤、大衛·P·里德和大衛·D·克拉克。
- 大規模機器學習的系統設計[論文]
- Facebook 資料中心中的深度學習推理:特徵描述、效能優化和硬體影響 [論文]
- Park、Jongsoo、Maxim Naumov、Protonu Basu 等人。 arXiv 2018
- 摘要:本文介紹了深度學習模型的特徵,然後展示了深度學習硬體的新設計原理。
- 柏克萊對人工智慧系統挑戰的看法 [論文]
書
- 電腦體系結構:量化方法 [必讀]
- 分散式機器學習模式[網站]
- 串流媒體系統 [書籍]
- Kubernetes in Action(開始閱讀)[書籍]
- 機器學習系統:可擴展的設計[網站]
- 對機器學習的信任[網站]
- 自動化機器學習的實際應用[網站]
影片
- ScalaDML2020:向機器學習社群中最優秀的人才學習。 [影片]
- Jeff Dean:「在大型線上服務中實現快速回應時間」主題演講 - Velocity 2014 [YouTube]
- 使用 PyTorch 從研究到生產 [影片]
- 微服務、Docker 和 Kubernetes 簡介 [YouTube]
- ICML 主題演講:幫助 20 萬名非機器學習專家使用機器學習的經驗教訓 [影片]
- 自適應和多任務學習系統[網站]
- 系統思考。 TED 演講。 [Youtube]
- 靈活的系統是機器學習的下一個前沿領域。傑夫·迪恩 [YouTube]
- 是時候用 Rust 重寫作業系統了嗎? [Youtube]
- InfoQ:人工智慧、機器學習與資料工程 [YouTube]
- Netflix:以人為中心的機器學習基礎設施 [InfoQ]
- SysML 2019:[YouTube]
- ScaledML 2019:David Patterson、Ion Stoica、Dawn Song 等 [YouTube]
- ScaledML 2018:Jeff Dean、Ion Stoica、Yangqing Jia 等 [YouTube] [幻燈片]
- 電腦體系結構歷史、挑戰與機會的新黃金時代。大衛·帕特森 [YouTube]
- 如何擁有糟糕的職業生涯。大衛·帕特森(我是忠實粉絲)[YouTube]
- SysML 18:前景與挑戰。邁克爾喬丹 [YouTube]
- SysML 18:系統與機器學習共生。傑夫·迪恩 [YouTube]
- AutoML 基礎:自動化機器學習的實際應用。宋清泉、金海峰、胡夏 [YouTube]
課程
- CS692 研討會:機器學習系統、系統機器學習 [GitHub]
- 網路主題:網路與系統的機器學習,2019 年秋季 [課程網站]
- CS6465:新興雲端技術與系統挑戰 [康乃爾大學]
- CS294:人工智慧系統與人工智慧系統。 【加州大學柏克萊分校春季學期】(強烈建議)【機器學習系統(2019 年秋季)】
- CSE 599W:機器學習系統。 【陳天琪】【華盛頓大學】
- EECS 598:人工智慧系統 (W'21)。 [莫沙拉夫喬杜里] [人工智慧系統 (W'21)]
- 有關如何用 2k 行建立自己的深度學習系統的教程程式碼 [GitHub]
- CSE 291F:進階資料分析和機器學習系統。 [加州大學聖地牙哥分校]
- CSci 8980:電腦系統中的機器學習 [明尼蘇達大學雙城分校]
- 穆力(MxNet、參數伺服器):深度學習簡介【我認為最好的DL課程】【書籍】
- 10-605:大型資料集的機器學習。 [卡內基美隆大學]
- CS 329S:機器學習系統設計。 [史丹佛]
部落格
- 跨多個 CPU/GPU 並行化以加速邊緣的深度學習推理 [亞馬遜部落格]
- 在幾分鐘內建立強大的、可投入生產的深度學習視覺模型 [部落格]
- 使用 Keras、FastAPI、Redis 和 Docker 部署機器學習模型 [部落格]
- 如何部署機器學習模型 - 使用 FastAPI + Uvicorn 建立生產就緒的 API [部落格] [GitHub]
- 將機器學習模型部署為 REST API [部落格]
- 機器學習的持續交付 [部落格]
- A4 格式的 Kubernetes 備忘單 [GitHub]
- Kubernetes 簡單介紹 [部落格]
- 使用 Web 介面訓練和部署機器學習模型 - Docker、PyTorch 和 Flask [GitHub]
- 學習 Kubernetes,中國道家之道 [GitHub]
- 資料管道、Luigi、Airflow:您需要了解的一切 [部落格]
- 深度學習工具集 — 概述 [部落格]
- CSE 599W 總結:機器學習系統 [中文部落格]
- Polyaxon、Argo 和 Seldon 用於 Kubernetes 中的模型訓練、包裝和部署 [部落格]
- 將機器學習 (ML) 模型投入生產的不同方法概述 [部落格]
- 成為資料科學家並不能讓你成為軟體工程師 [第 1 部分] 建立機器學習管道 [第 2 部分]
- PyTorch 中的模型服務 [部落格]
- Netflix 中的機器學習 [Medium]
- SciPy 會議資料(幻燈片、儲存庫)[GitHub]
- 繼Spark之後,加州大學柏克萊分校推出新一代AI計算引擎-Ray [部落格]
- 了解/從事機器學習/深度學習系統相關的研究需要什麼樣的知識結構?
- 在 3 小時內學習 Kubernetes:編排容器的詳細指南 [部落格] [GitHub]
- 資料工程師路線圖:向矽谷多家公司學習。 Netflix、Facebook、Google、新創公司 [GitHub]
- TensorFlow Serving + Docker + Tornado 機器學習模式生產級快速部署 [部落格]
- 將機器學習模型部署為 REST API [部落格]
- Colossal-AI:大模型時代的統一深度學習系統 [部落格] [GitHub]
- 資料工程師路線圖 [Scaler 部落格]