欲了解更多精彩,請查看 .
這是一個精選的資源列表,包含開發機器學習解決方案所需的一切。
此列表中的每一項都會教您至少一項獨特且重要的技能或資訊。
內容分為三個等級:
?所有機器學習工程師的必備讀物
?專業機器學習工程師的進階讀物
?為專家 ML 工程師提供的專家資料
寫描述是為了完成句子“閱讀本文後,您將學到......” 。
溝通
軟體工程
機器學習
開發營運
BLUF:可以讓您的寫作更強大的軍事標準 - 如何讓您的溝通更強大(5 分鐘)
XY 問題 - 在尋求協助時如何專注於解釋您的最終目標(5 分鐘)
自行車脫落:身為工程師,你有多成熟? - 如何避免和發現自行車脫落(5 分鐘)
像老闆一樣發送電子郵件 - 如何撰寫更好的電子郵件(5 分鐘)
停止瑞士人打亂您的日曆 - 如何管理您的日曆以便您可以集中精力(15 分鐘)
如何用簡單的英語寫作 - 如何用簡單的英語寫作(30 分鐘)
簡報規則 - 如何創建出色的幻燈片(30 分鐘)
SMART 標準 - 如何定義目標(15 分鐘)
MECE 原則 - 如何將問題完全分解為結構化清單(15 分鐘)
SCQA:它是什麼,它是如何運作的,它對我有什麼幫助? - 如何建立您的簡報、提案和銷售大綱(15 分鐘)
不再有誤解 - 如何透過釋義避免誤解(15 分鐘)
非暴力溝通 - 如何在困難情況下提供建設性回饋(15 分鐘)
光環效應 - 如何識別並利用光環效應為您帶來優勢(15 分鐘)
神話人月 - 專案中的人日和吞吐量時間之間的關係(15 分鐘)
四面模型 - 如何透過考慮接收者如何解釋您的訊息來進行有效溝通(30 分鐘)
語意版本控制 - 如何提升應用程式和軟體包的版本(15 分鐘)
Python 中的__all__
和野生導入 - __all__
如何定義 Python 套件的公共 API(15 分鐘)
用於機器學習的 API - 如何為機器學習應用程式設計 RESTful API(30 分鐘)
FastAPI 文件 - 如何建立與 OpenAPI 規格一一對應的 RESTful API(1 天)
三法則 - 何時建立可重複使用元件、何時不建構(15 分鐘)
程式設計師對時間的誤解 - 如何避免關於時間的常見陷阱(15 分鐘)
程式設計師對名稱的誤解 - 如何避免有關名稱的常見陷阱(15 分鐘)
命令列介面指南 - 如何編寫出色的 CLI(1 小時)
Zalando 的 RESTful API 指南 - 如何設計 RESTful API(1 天)
Poetry Cookiecutter - 如何為 Python 套件和應用程式建立基於 Poetry 的現代開發環境(30 分鐘)
優秀 Git 提交訊息的七個規則 - 如何寫優秀 Git 提交訊息(15 分鐘)
學習 Git 分支 - 從初級到高級練習 Git(1 小時)
保留變更日誌 - 如何保留應用程式和軟體包的變更日誌(30 分鐘)
傳統提交 - 如何為提交訊息添加前綴以自動進行語義版本控制並保留變更日誌(15 分鐘)
使用 Pytest 測試 Python 應用程式 - 如何使用 pytest 正確測試套件(30 分鐘)
成功的 Git 分支模型 - 如何使用 Git 發佈軟體(15 分鐘)
程式碼審查最佳實踐 - 審查 Pull 請求時要注意什麼(30 分鐘)
程式碼健康:尊重的評論 == 有用的評論 - 如何尊重地傳達程式碼審查意見(15 分鐘)
程式碼審查金字塔 - 審查 Pull 請求時要尋找什麼以及要自動化什麼(15 分鐘)
Poetry 工作區外掛程式 - 如何建立和管理基於 Poetry 的 monorepo(15 分鐘)
PEP20「Python 之禪」 - 如何寫出慣用的 Python(15 分鐘)
Python import 語句權威指南 - 如何寫 import 語句(30 分鐘)
了解 Python 的日誌記錄模組 - 如何有效地使用logging
模組(30 分鐘)
不要在導入時執行程式碼 - 為什麼不應該在導入時執行程式碼
請修復你的裝飾器 - 為什麼你應該使用wrapt
來編寫你的裝飾器(30分鐘)
不記錄 - 您應該做什麼來代替記錄(30 分鐘)
The Little Book of Python Anti-Patterns - Python 反模式合輯(X 小時)
有效Python - Python習語合集(X小時)
Python 設計模式 - 軟體架構模式集合(1 小時)
SOLID - 一套標準的軟體架構模式(1 小時)
什麼他媽的Python! - 如何透過了解 Python 的邊緣情況來掌握 Python(1 天)
mypy 綜合指南 - 如何在 Python 中編寫類型註解(1 小時)
Pydantic 概述 - 如何為複雜類型編寫類型註解而不是無意義的Dict[str, Any]
(1 小時)
幻數 - 為什麼幻值是一種反模式(15 分鐘)
Enums - 如何在 Python 中編寫Enum
而不是類型不安全的魔法值(15 分鐘)
Mypy 泛型 - 如何使用TypeVar
編寫泛型類型,例如List[T]
(30 分鐘)
Mypy 協定 - 如何使用Protocol
定義Iterable
等介面(30 分鐘)
cookiecutter - 使用 Cookiecutter 範本快速建立新的 Python 套件或應用程式
cruft - 更新 Python 套件的底層 Cookiecutter 鷹架
commitizen - 檢查提交訊息是否符合常規提交並自動執行語義版本控制並保留更改日誌
詩歌 - 管理 Python 專案的打包和依賴項
poe - 使用 Poe the Poet 在 Poetry 專案中定義和執行任務
詩歌工作空間插件 - 使用此詩歌插件管理 Python monorepo
黑色 - 自動格式化您的程式碼
isort - 自動對導入語句進行排序
預提交 - 在提交時自動執行程式碼品質檢查
bandit - 尋找常見的安全性問題
darglint - 檢查您的文件字串是否與您的函式簽章相符
flake8 - 檢查您的程式碼是否有錯誤以及您的程式碼風格是否符合 PEP8
flake8 擴展 - Flake8 擴展的精彩列表
mypy - 檢查程式碼的類型正確性
預提交掛鉤 - 檢查文件品質的預提交掛鉤的集合
pydocstyle - 檢查您的程式碼是否已記錄
pygrep hooks - 檢查常見 Python 程式碼味道的預提交鉤子集合
pytest-recording - 在 pytest 測試中記錄和回放 HTTP 請求
? pyupgrade - 檢查您的程式碼是否是使用最新的 Python 語言功能編寫的
?安全性 - 檢查您的依賴項是否有任何已知的安全漏洞
? shellcheck - 檢查 shell 腳本的質量
? coverage.py - 檢查程式碼的測試覆蓋率
?假設 - 編寫自動查找破壞程式碼的邊緣情況的測試
? Hypothesis-auto - 根據程式碼的類型註解自動產生假設測試
? fastapi - 基於類型註解建立 RESTful API
? typer - 基於類型註解建立 CLI
? Streamlit - 使用單一 Python 檔案建立 Web 應用程式
? Bump2version - 發佈軟體包的新版本
? colorlogs - 用顏色提高日誌的可讀性
? hvplot - 從 pandas 資料幀建立互動式繪圖
? mkdocs - 為您的專案建立開發人員文檔
? pdoc - 為您的程式碼產生 API 文檔
? Birdseye - 以圖形方式調試您的 Python 程式碼
? scalene - 按行分析程式碼的 CPU 和記憶體使用情況
? viztracer - 使用火焰圖視覺化程式碼的效能
? tqdm - 輕鬆為長時間運行的作業新增進度條
?偏差-變異數權衡 - 模型的總誤差如何等於偏差和變異數總和(30 分鐘)
?交叉驗證的兩種不同用途 - 如何使用巢狀交叉驗證來結合交叉驗證的兩種不同用途(30 分鐘)
?眾數、中位數和平均值:統一的視角 - 為什麼最小化平均絕對誤差 (MAE) 比最小化均方誤差 (MSE) 更穩健(30 分鐘)
?反向傳播是計算梯度的鍊式法則 - 反向傳播如何是計算目標函數梯度的演算法(30 分鐘)
?堆疊泛化 - 如何堆疊模型(30 分鐘)
?我們對 t-SNE 和 UMAP 使用了錯誤的初始化 - 如何正確初始化 t-SNE 和 UMAP(15 分鐘)
?從經典的全連接網路到 Transformers - 神經網路如何從全連接網路演變為 Transformers(30 分鐘)
? .632+ 規則是什麼? - 如何透過引導來衡量泛化表現(30 分鐘)
?有洩漏和無洩漏的堆疊策略 - 堆疊模型的不同策略(30 分鐘)
?資料分佈變化與監控 - 如何偵測和解決不同類型的資料變化(1 小時)
?反向傳播不僅僅是鍊式法則 - 反向傳播與拉格朗日乘子的關係(30 分鐘)
?為什麼 ML 演算法難以調整 - 當 Pareto 前緣為凹時優化多個目標(30 分鐘)
?深度學習模型壓縮 - 如何使用量化、剪枝和蒸餾來壓縮模型(30 分鐘)
? SHAP:SHApley Additive exPlanations - 如何以 Shapley 值解釋模型的產出(30 分鐘)
? Shapley 和 SHAP 簡介 - 如何透過 SHAP 近似 Shapley 值(30 分鐘)
? UMAP:統一流形逼近和投影 - 如何降低視覺化和建模的維度(30 分鐘)
? PyNNDescent - 如何在巨大的資料集中找到最近的鄰居(15 分鐘)
?精確度和召回率 - 精確度和召回率如何衡量分類器的性能(30 分鐘)
?機率校準 - 應如何以及針對哪些模型類型將模型的輸出分數校準為機率(30 分鐘)
?你們都錯誤地計算了流失率 - 正確定義什麼是流失(30 分鐘)
?高斯過程 - 從頭開始 - 如何使用高斯過程建立機率回歸模型(1 小時)
? Microsoft 的 Document Image Transformer - 自監督預訓練模型,可在 PubLayNet 上實現 SotA 效能,並可用於各種下游任務(30 分鐘)
? Awesome Sentence Embedding - 預訓練句子和單字嵌入模型的精選清單(15 分鐘)
? Prophet 模型 - Meta 的 Prophet 模型如何將時間序列分解為趨勢、季節性和假日成分(30 分鐘)
? Darts - 用 Python 輕鬆實現時間序列 - 如何使用darts
建立預測模型(1 小時)
? Microsoft Recommenders - 建議系統模型比較(30 分鐘)
?我希望有人告訴我有關張量計算庫的資訊 - JAX、PyTorch、TensorFlow 和 Theano 有何不同(30 分鐘)
?現代熊貓系列(第 1 - 7 部分)- 寫慣用的熊貓(1 小時)
? Awesome Pandas - 很棒的 Pandas 資源清單(1 小時)
?使用 scikit-learn Pipelines 和 FeatureUnions - 如何使用Pipeline
建立端對端模型(30 分鐘)
?在迴歸中轉換目標 - 如何轉換目標以建立更穩健的模型(15 分鐘)
?用於異質資料的 ColumnTransformer - 如何使用ColumnTransformer
在 sklearn Pipeline
中處理 pandas DataFrame(30 分鐘)
?自訂估算器 - 建立您自己的自訂Estimator
(30 分鐘)
?連續減半的超參數最佳化 - 如何使用計算效率最高的方法最佳化超參數(30 分鐘)
? Doccano - 用於標記文字的工具(30 分鐘)
? CVAT:電腦視覺註釋工具 - 用於標記圖像的工具(30 分鐘)
?很棒的數據標籤 - 很棒的數據標籤工具清單(30 分鐘)
?呼叫 - 如何實現作為 CLI 在專案上運行的常見任務(30 分鐘)
? poe - 如何實現作為 CLI 在專案上運行的常見任務(30 分鐘)
? Python with Poetry 的打包和依賴項管理簡介 - 如何管理 Python 套件的依賴項和環境(30 分鐘)
?用於機器學習的 Pyenv 簡介 - 如何使用 pyenv 管理 Python 解釋器(30 分鐘)
?現代 Python 環境 - 依賴項和工作區管理 - pyenv、venv + pip、venv + pip-tools、poetry、pipenv 和 conda 之間的比較(30 分鐘)
? Conda:神話與誤解 - 關於 Conda 的常見誤解(15 分鐘)
? Docker 課程 - 如何使用 Docker(4 小時)
? Docker 層快取 - 如何編寫 Dockerfile 以從層快取中受益(30 分鐘)
? Dockerfile 最佳實踐 - 如何編寫好的 Dockerfile(1 小時)
?為 Docker 配置 Gunicorn - 如何為 Docker 映像最佳配置 Gunicorn(30 分鐘)
?使用 BuildKit 的新快取加速 Docker - 如何使用建置快取加速 Docker 建置(30 分鐘)
?在 Docker 和 Compose 中建立機密,安全的方式 - 如何在 Docker 建置中使用機密(15 分鐘)
? Python 和 Docker 的安全掃描器 - 如何掃描 Docker 映像以尋找程式碼和 Docker 映像的安全性問題(30 分鐘)
?喊狼來了的安全掃描器 - 如何掃描 Docker 映像中的安全問題而不出現誤報(15 分鐘)
? Awesome Docker - 很棒的 Docker 資源清單(30 分鐘)
?遠大的期望 - 如何測試和記錄您的數據和數據管道(30 分鐘)
? Cron 最佳實踐 - 如何最好地使用 cron 來安排任務(30 分鐘)
? SSH 隧道視覺化指南 - 如何使用 SSH 轉送連接埠和建立隧道(30 分鐘)
?在 bash 中安全地執行操作 - 如何編寫安全且健壯的 shell 腳本(1 小時)
?您的終端機不是終端機:流簡介 - 您的終端如何成為操作流的工具(30 分鐘)
? Bash Heredoc - 如何使用 Heredoc 將多行參數傳遞給命令(30 分鐘)
?請停止編寫 shell 腳本 - 為什麼不應為 CI/CD 或 Docker 映像編寫 shell 腳本(30 分鐘)
? Terraform 簡介 - 如何使用 Terraform(1 小時)
? Terraform 最佳實務 - Terraform 最佳實務(1 小時)
? Terraform 預先提交掛鉤集合 - 如何透過預提交自動化 Terraform 程式碼品質檢查(1 小時)
? Awesome Terraform - 很棒的 Terraform 資源清單(30 分鐘)
? Terraform 教學 - 如何開始使用 Terraform(1 小時)
?將 Redis 記憶體儲存用於您的 Python 應用程式 - 如何使用 Redis 作為 Python 應用程式的記憶體快取(30 分鐘)
? Python Kafka 消費者:至少一次、最多一次、剛好一次 - 如何用 Python 寫不同類型的 Kafka 消費者(30 分鐘)
? Kafka Exactly-Once-Semantics - 如何只生產和消費訊息一次(1 小時)
? RabbitMQ:具有持久性的訊息佇列庫 - RabbitMQ 是具有訊息代理程式的訊息系統(4 小時)
? ZeroMQ:帶有訊息佇列原語的套接字庫 - ZeroMQ 是一個沒有訊息代理程式的輕量級訊息系統(8 小時)
Super Linear 是一家總部位於比利時的機器學習公司。
我們發明、設計和開發人工智慧驅動的軟體。我們與客戶一起確定組織內的哪些問題可以透過人工智慧解決,並展示人工智慧對每個問題的價值。
我們的團隊不斷尋找新穎且表現更好的解決方案,我們互相挑戰,為我們的客戶和我們的公司提出最好的想法。
以下是我們利用機器學習(人工智慧背後的技術)所做的一些範例:
幫助求職者找到符合他們期望的好工作。在比利時公共就業服務網站上,您可以僅根據您的履歷找到我們的工作推薦。
幫助醫院節省時間。我們從病人出院信中提取診斷結果。
透過偵測山寨文章幫助出版商評估其影響。
我們一起努力工作,一起享受樂趣。我們培養協作文化,讓每個團隊成員在接受挑戰時感受到支持,在承擔責任時感受到信任。