さらなる素晴らしさについては、をチェックしてください。
これは、機械学習ソリューションの開発に必要なものすべてを網羅した、魅力的なリソースの厳選されたリストです。
このリストの各項目は、少なくとも 1 つの明確で重要なスキルまたは情報を教えてくれます。
コンテンツ レベルは 3 つあります。
?すべての ML エンジニアの必読書
?プロの ML エンジニア向けの高度な読書
?エキスパート ML エンジニア向けの専門資料
説明は、「この記事を読んだ後、あなたは...を学んだことになります。」という文を完成させるために書かれています。
コミュニケーション
ソフトウェアエンジニアリング
機械学習
DevOps
BLUF: 文章をより強力にする軍事規格 - コミュニケーションをより強力にする方法 (5 分)
XY 問題 - 助けを求めるときに最終目標の説明に集中する方法 (5 分)
バイク小屋: あなたはエンジニアとしてどの程度成熟していますか? - 自転車駐輪場を避ける方法と声をかける方法 (5 分)
上司のような電子メール - より良い電子メールの書き方 (5 分)
カレンダーのスイスチーズをやめる - 集中できるようにカレンダーを管理する方法 (15 分)
わかりやすい英語で書く方法 - わかりやすい英語で書く方法 (30 分)
プレゼンテーションのルール - 優れたスライド資料の作成方法 (30 分)
SMART 基準 - 目標を定義する方法 (15 分)
MECE 原則 - 問題を構造化リストに完全に分解する方法 (15 分)
SCQA: それは何ですか、どのように機能し、どのように役立つのですか? - プレゼンテーション、提案書、営業概要の構成方法 (15 分)
もう誤解はありません - 言い換えることで誤解を避ける方法 (15 分)
非暴力コミュニケーション - 困難な状況で建設的なフィードバックを提供する方法 (15 分)
ハロー効果 - ハロー効果を認識し、有利に使用する方法 (15 分)
神話上の人月 - プロジェクトにおける人日とスループット時間の関係 (15 分)
4 面モデル - 受信者がメッセージをどのように解釈するかを考慮して効果的にコミュニケーションする方法 (30 分)
セマンティック バージョニング - アプリとパッケージのバージョンを上げる方法 (15 分)
Python の__all__
とワイルド インポート - __all__
Python パッケージのパブリック API を定義する方法 (15 分)
機械学習用の API - 機械学習アプリケーション用の RESTful API を設計する方法 (30 分)
FastAPI ドキュメント - OpenAPI 仕様と 1 対 1 で対応する RESTful API を構築する方法 (1 日)
3 つのルール - 再利用可能なコンポーネントをビルドする場合とそうでない場合 (15 分)
プログラマーは時間に関する虚偽を信じている - 時間に関するよくある落とし穴を回避する方法 (15 分)
プログラマーは名前について虚偽を信じている - 名前に関するよくある落とし穴を避ける方法 (15 分)
コマンド ライン インターフェイスのガイドライン - 優れた CLI の作成方法 (1 時間)
Zalando の RESTful API ガイドライン - RESTful API の設計方法 (1 日)
Poetry Cookiecutter - Python パッケージおよびアプリ用の最新の Poetry ベースの開発環境を構築する方法 (30 分)
優れた Git コミット メッセージの 7 つのルール - 優れた Git コミット メッセージの書き方 (15 分)
Git ブランチングを学ぶ - 初心者から上級者まで Git を練習する (1 時間)
変更ログを保存する - アプリとパッケージの変更ログを保存する方法 (30 分)
従来のコミット - セマンティック バージョニングを自動化し、変更ログを保持するためにコミット メッセージにプレフィックスを付ける方法 (15 分)
Pytest を使用した Python アプリケーションのテスト - pytest を使用してパッケージを適切にテストする方法 (30 分)
成功する Git ブランチング モデル - Git を使用してソフトウェアをリリースする方法 (15 分)
コード レビューのベスト プラクティス - プル リクエストをレビューする際に注意すべきこと (30 分)
コードの健全性: 敬意を持ったレビュー == 役立つレビュー - コード レビューのコメントを敬意を持って伝える方法 (15 分)
コード レビュー ピラミッド - プル リクエストをレビューするときに何を確認し、何を自動化するか (15 分)
Poetry ワークスペース プラグイン - Poetry ベースのモノリポジトリを作成および管理する方法 (15 分)
PEP20 「Python の禅」 - 慣用的な Python の書き方 (15 分)
Python インポート ステートメントの決定版ガイド - インポート ステートメントの書き方 (30 分)
Python のロギング モジュールを理解する - logging
モジュールを効果的に使用する方法 (30 分)
インポート時にコードを実行しない - インポート時にコードを実行してはいけない理由
デコレータを修正してください - デコレータを記述するためにおそらくwrapt
使用する必要がある理由 (30 分)
ログを記録しない - ログを記録する代わりに行うべきこと (30 分)
The Little Book of Python Anti-Patterns - Python アンチパターンのコレクション (X 時間)
効果的な Python - Python イディオムのコレクション (X 時間)
Python デザイン パターン - ソフトウェア アーキテクチャ パターンのコレクション (1 時間)
SOLID - ソフトウェア アーキテクチャ パターンの標準セット (1 時間)
なんてクソパイソンだ! - エッジケースを理解して Python をマスターする方法 (1 日)
mypy の総合ガイド - Python で型アノテーションを記述する方法 (1 時間)
Pydantic の概要 - 意味のないDict[str, Any]
の代わりに複合型の型アノテーションを記述する方法 (1 時間)
マジック ナンバー -マジック ナンバーがアンチパターンである理由 (15 分)
Enum - 型安全でないマジック値の代わりに Python でEnum
を記述する方法 (15 分)
Mypy ジェネリック - TypeVar
を使用してList[T]
などのジェネリック型を記述する方法 (30 分)
Mypy プロトコル - Protocol
使用してIterable
などのインターフェイスを定義する方法 (30 分)
cookiecutter - Cookiecutter テンプレートを使用して、新しい Python パッケージまたはアプリをすばやくスキャフォールディングします
cruft - Python パッケージの基礎となる Cookiecutter スキャフォールディングを更新します
commitizen - コミットメッセージが従来のコミットを満たしていることを確認し、セマンティックバージョニングを自動化し、変更ログを保存します
詩 - Python プロジェクトのパッケージ化と依存関係を管理します
poe - Poe the Poet を使用して Poetry プロジェクトでタスクを定義して実行します
Poetry-workspace-plugin - この Poetry プラグインを使用して Python モノリポジトリを管理します
黒 - コードを自動的にフォーマットします
isort - import ステートメントを自動的にソートします
pre-commit - コミット時にコード品質チェックを自動的に実行します
Bandit - 一般的なセキュリティ問題を見つける
darglint - docstring が関数のシグネチャと一致することを確認する
flake8 - コードにバグがないか、コード スタイルが PEP8 に準拠していることを確認します。
flake8 拡張機能 - Flake8 拡張機能の素晴らしいリスト
mypy - コードの型の正確性をチェックする
pre-commit フック - ファイルの品質をチェックする pre-commit フックのコレクション
pydocstyle - コードが文書化されていることを確認する
pygrep フック - 一般的な Python コードの匂いをチェックするコミット前フックのコレクション
pytest-recording - pytest テストで HTTP リクエストを記録して再生します
? pyupgrade - コードが最新の Python 言語機能を使用して記述されていることを確認します
?安全性 - 依存関係に既知のセキュリティ脆弱性がないことを確認します。
? shellcheck - シェルスクリプトの品質をチェックします
? Coverage.py - コードのテスト カバレッジを確認する
?仮説 - コードを壊すエッジケースを自動的に探すテストを作成します。
?仮説自動 - コードの型アノテーションに基づいて仮説テストを自動生成します
? fastapi - 型アノテーションに基づいて RESTful API を作成する
? typer - 型アノテーションに基づいて CLI を作成する
? streamlit - 単一の Python ファイルで Web アプリを作成する
? Bump2version - パッケージの新しいバージョンをリリースします
? colorlogs - 色を付けてログの可読性を高めます
? hvplot - pandas データフレームからインタラクティブなプロットを作成する
? mkdocs - プロジェクトの開発者ドキュメントを作成する
? pdoc - コードの API ドキュメントを生成します
? Birdseye - Python コードをグラフィカルにデバッグします
? scalene - コードの CPU とメモリの使用量を行ごとにプロファイリングします
? viztracer - フレームグラフを使用してコードのパフォーマンスを視覚化します
? tqdm - 長時間実行されるジョブに進行状況バーを簡単に追加する
?バイアスと分散のトレードオフ - モデルの合計誤差がどのようにバイアスと分散の合計になるか (30 分)
?相互検証の 2 つの異なる使用法 - ネストされた相互検証を使用して、相互検証の 2 つの異なる使用法を組み合わせる方法 (30 分)
?最頻値、中央値、平均: 統一的な視点 - 平均絶対誤差 (MAE) を最小化する方が平均二乗誤差 (MSE) を最小化するよりも堅牢である理由 (30 分)
?バックプロパゲーションは勾配を計算するための連鎖則です - バックプロパゲーションが目的関数の勾配を計算するアルゴリズムである方法 (30 分)
?積み重ねられた一般化 - モデルを積み重ねる方法 (30 分)
? t-SNE と UMAP に間違った初期化を使用しています - t-SNE と UMAP を適切に初期化する方法 (15 分)
?古典的な完全接続ネットワークからトランスフォーマーへ - ニューラル ネットワークが完全接続ネットワークからトランスフォーマーにどのように進化したか (30 分)
? .632+ ルールとは何ですか? - ブートストラップを使用して汎化パフォーマンスを測定する方法 (30 分)
?リークありおよびリークなしのスタッキング戦略 - モデルをスタッキングするためのさまざまな戦略 (30 分)
?データ分散のシフトとモニタリング - さまざまな種類のデータ シフトを検出して対処する方法 (1 時間)
?逆伝播は単なる連鎖則ではありません - 逆伝播とラグランジュ乗数の関係 (30 分)
? ML アルゴリズムの調整が難しい理由 - パレート フロントが凹面の場合に複数の目的を最適化する (30 分)
?深層学習モデルの圧縮 - 量子化、枝刈り、蒸留を使用してモデルを圧縮する方法 (30 分)
? SHAP: SHapley Additive の説明 - Shapley 値を使用してモデルの出力を説明する方法 (30 分)
? Shapley と SHAP の紹介 - SHAP によって Shapley 値がどのように近似されるか (30 分)
? UMAP: 均一多様体近似と投影 - 視覚化とモデリングのために次元を削減する方法 (30 分)
? PyNNDescent - 巨大なデータセットで最近傍を見つける方法 (15 分)
?適合率と再現率 - 適合率と再現率によって分類器のパフォーマンスを測定する方法 (30 分)
?確率の調整 - モデルの出力スコアを確率に調整する方法とモデルの種類 (30 分)
?皆さんは解約率の計算を間違っています - 解約とは何かを正しく定義してください (30 分)
?ガウス過程 - ゼロから - ガウス過程を使用して確率回帰モデルを構築する方法 (1 時間)
? Microsoft の Document Image Transformer - PubLayNet で SotA パフォーマンスを実現し、さまざまなダウンストリーム タスクに使用できる自己教師型の事前トレーニング済みモデル (30 分)
?素晴らしい文埋め込み - 事前トレーニングされた文および単語埋め込みモデルの厳選されたリスト (15 分)
? Prophet モデル - Meta の Prophet モデルが時系列をトレンド、季節性、休日の要素に分解する方法 (30 分)
? Darts - Python で時系列を簡単に - darts
を使用して予測モデルを構築する方法 (1 時間)
? Microsoft Recommenders - レコメンダー システム モデルの比較 (30 分)
? Tensor 計算ライブラリについて誰かに教えてほしかったこと - JAX、PyTorch、TensorFlow、および Theano の違い (30 分)
?現代のパンダ シリーズ (パート 1 ~ 7) - 慣用的なパンダを書く (1 時間)
? Awesome Pandas - Pandas リソースの素晴らしいリスト (1 時間)
? scikit-learn パイプラインと FeatureUnions の使用 - Pipeline
使用してエンドツーエンド モデルを構築する方法 (30 分)
?回帰におけるターゲットの変換 - より堅牢なモデルを構築するためにターゲットを変換する方法 (15 分)
?異種データ用の ColumnTransformer - ColumnTransformer
使用して sklearn Pipeline
でパンダ データフレームを処理する方法 (30 分)
?カスタム見積もり - 独自のカスタムEstimator
を作成する (30 分)
?連続半減によるハイパーパラメータの最適化 - 最も計算効率の高い方法でハイパーパラメータを最適化する方法 (30 分)
? Doccano - テキストにラベルを付けるツール (30 分)
? CVAT: Computer Vision Annotation Tool - 画像にラベルを付けるためのツール (30 分)
?素晴らしいデータ ラベル付け - データ ラベル付けツールの素晴らしいリスト (30 分)
? invoke - プロジェクトで実行する一般的なタスクを CLI として実装する方法 (30 分)
? poe - プロジェクトで実行する一般的なタスクを CLI として実装する方法 (30 分)
? Poetry による Python のパッケージ化と依存関係管理の紹介 - Python パッケージの依存関係と環境を管理する方法 (30 分)
?機械学習のための Pyenv の紹介 - pyenv を使用して Python インタープリターを管理する方法 (30 分)
?最新の Python 環境 - 依存関係とワークスペース管理 - pyenv、venv + pip、venv + pip-tools、poetry、pipenv、conda の比較 (30 分)
? Conda: 神話と誤解 - Conda に関するよくある誤解 (15 分)
? Docker カリキュラム - Docker の使用方法 (4 時間)
? Docker レイヤー キャッシュ - レイヤー キャッシュを活用するための Dockerfile の作成方法 (30 分)
? Dockerfile のベスト プラクティス - 優れた Dockerfile を作成する方法 (1 時間)
? Gunicorn を Docker 用に構成する - Docker イメージ用に Gunicorn を最適に構成する方法 (30 分)
? BuildKit の新しいキャッシュで Docker を高速化する - ビルド キャッシュを使用して Docker ビルドを高速化する方法 (30 分)
? Docker と Compose でシークレットを構築する安全な方法 - Docker ビルドでシークレットを使用する方法 (15 分)
? Python および Docker のセキュリティ スキャナー - コードと Docker イメージのセキュリティ上の問題について Docker イメージをスキャンする方法 (30 分)
?オオカミを叫んだセキュリティ スキャナー - 誤検知を発生させずに Docker イメージをスキャンしてセキュリティ上の問題を検出する方法 (15 分)
?素晴らしい Docker - Docker リソースの素晴らしいリスト (30 分)
?大きな期待 - データとデータ パイプラインをテストして文書化する方法 (30 分)
? Cron のベスト プラクティス - cron を最適に使用してタスクをスケジュールする方法 (30 分)
? SSH トンネルのビジュアル ガイド - SSH を使用してポートを転送し、トンネルを作成する方法 (30 分)
? bash で作業を行う安全な方法 - 安全で堅牢なシェル スクリプトを作成する方法 (1 時間)
?あなたの端末は端末ではありません: ストリームの概要 - 端末がどのようにストリームを操作するツールになるか (30 分)
? Bash Heredoc - ヒアドキュメントを使用して複数行の引数をコマンドに渡す方法 (30 分)
?シェル スクリプトの作成をやめてください - CI/CD または Docker イメージのシェル スクリプトを作成してはいけない理由 (30 分)
? Terraform の概要 - Terraform の使用方法 (1 時間)
? Terraform のベスト プラクティス - Terraform のベスト プラクティス (1 時間)
? Terraform のプリコミット フック コレクション - プリコミットを使用して Terraform コードの品質チェックを自動化する方法 (1 時間)
?素晴らしい Terraform - Terraform リソースの素晴らしいリスト (30 分)
? Terraform チュートリアル - Terraform を使い始める方法 (1 時間)
? Python アプリケーションでの Redis インメモリ ストレージの使用 - Python アプリケーションのメモリ内キャッシュとして Redis を使用する方法 (30 分)
? Python Kafka コンシューマ: 少なくとも 1 回、最大 1 回、正確に 1 回 - Python でさまざまなタイプの Kafka コンシューマを作成する方法 (30 分)
? Kafka Exactly-Once-Semantics - メッセージを正確に 1 回 (1 時間) 生成および消費する方法
? RabbitMQ: 永続性を備えたメッセージ キュー ライブラリ - RabbitMQ はメッセージ ブローカーを備えたメッセージング システムです (4 時間)
? ZeroMQ: メッセージ キュー プリミティブを備えたソケット ライブラリ - ZeroMQ は、メッセージ ブローカーを使用しない軽量のメッセージング システムです (8 時間)
Superlinear は、ベルギーに拠点を置く機械学習企業です。
私たちは AI を活用したソフトウェアを発明、設計、開発します。私たちはクライアントと協力して、組織内のどの問題を AI で解決できるかを特定し、各問題に対する人工知能の価値を実証します。
私たちのチームは常に斬新でパフォーマンスの高いソリューションを探しており、お客様と当社にとって最高のアイデアを見つけるためにお互いに挑戦しています。
AI の背後にあるテクノロジーである機械学習を使用して行うことの例をいくつか示します。
求職者が期待に見合った素晴らしい仕事を見つけられるように支援します。ベルギー公共雇用サービスの Web サイトでは、履歴書のみに基づいて推奨される仕事を見つけることができます。
病院の時間を節約するのに役立ちます。患者の退院届から診断を抽出します。
模倣記事を検出することで、パブリッシャーがその影響を推定できるようにします。
私たちは一生懸命働き、一緒に楽しんでいます。私たちは、チームメンバーが挑戦するときにサポートされ、責任を負うときに信頼されていると感じるコラボレーションの文化を育みます。