このリポジトリには、Jon Krohn のMachine Learning Foundationsカリキュラムに付随するコードが含まれており、ディープ ラーニングやその他の人工知能を含む、現代の機械学習アプローチの基礎となる、数学、統計、コンピューター サイエンスにわたるすべての主題の包括的な概要を提供します。テクニック。
カリキュラムには 8 つの科目があり、4 つの主題領域に編成されています。これらが重要な基礎主題領域である理由の詳細については、以下の「機械学習ハウス」セクションを参照してください。
後の主題は以前の主題の内容に基づいて構築されるため、推奨されるアプローチは、指定された順序で 8 つの主題を進めることです。とはいえ、興味やその内容に対する既存の知識に基づいて、個々の主題を選んでいただいてもかまいません。特に、4 つの主題領域はそれぞれかなり独立しているため、個別にアプローチすることができます。
ML Foundations の8 つの科目は、当初、2020 年 5 月から 9 月にかけてオライリー学習プラットフォームのライブ オンライン トレーニングとして Jon Krohn によって提供されました (2 回目は 2021 年 7 月から 12 月にかけて提供されました。個々の講義の日程については、こちらを参照してください)。
好みの学習モードに合わせて、コンテンツは複数のチャネル経由で利用できるようになりました。
(YouTube には教えられたコンテンツの 100% が含まれていますが、有料オプション (Udemy、O'Reilly、ODSC など) には、YouTube では利用できない演習のための包括的なソリューションのウォークスルーが含まれていることに注意してください。有料オプションの一部には、インタラクティブなテスト、「カンニング シート」、コースを正常に完了した場合の証明書の授与など、プラットフォーム固有の独占的な機能が含まれます。)
今後のライブ トレーニング セッション、新しいビデオのリリース、本の章のリリースに関する最新情報を入手するには、Jon Krohn のホームページから電子メール ニュースレターに登録することを検討してください。
すべてのコードは、このディレクトリの Jupyter ノートブック内で提供されます。これらのノートブックは、(無料の) Colab クラウド環境内で使用することを目的としており、現在アクティブにサポートされている唯一の環境です。
ただし、Jupyter ノートブックをローカルで実行することに慣れている場合は、そうしても問題ありません (このリポジトリの Dockerfile 内のライブラリ バージョンは必ずしも最新である必要はありませんが、Docker コンテナ内で Jupyter を実行するための適切な開始点となる可能性があることに注意してください)。 。
優れたデータ サイエンティストまたは ML エンジニアになるには、最も一般的なライブラリ (scikit-learn、Keras など) が提供する抽象インターフェイスを介して ML アルゴリズムを使用する方法を知っているだけでは十分ではありません。革新的なモデルをトレーニングしたり、本番環境でパフォーマンスよく実行できるようにデプロイしたりするには、機械学習理論 (「機械学習ハウス」の中央の紫色の床として描かれている) を深く理解することが役立つか、不可欠である可能性があります。そして、ML に対するこれほど深い理解を養うには、基礎的な主題について実用的な理解を持っていなければなりません。
「機械学習ハウス」の基礎がしっかりしていると、一般的な ML 原則 (紫色の床) から、ディープ ラーニング、自然学習などの特殊な ML ドメイン (最上階、灰色で表示) へのジャンプがはるかに簡単になります。言語処理、マシンビジョン、強化学習。これは、アプリケーションがより専門的であればあるほど、実装の詳細は学術論文または大学院レベルの教科書でしか入手できない可能性が高く、どちらも通常は基礎的な主題の理解を前提としているためです。
このシリーズの内容は、次のような場合に特に関連性があります。
基本的な主題はここ数十年ほとんど変わっておらず、今後数十年も変わらないと思われますが、すべての機械学習およびデータ サイエンスのアプローチにおいて重要です。このようにして、基礎はキャリアにわたる強固な基盤となります。
このシリーズの目的は、取り上げられている内容を実践的かつ機能的に理解できるようにすることです。各トピックにはコンテキストが示され、機械学習との関連性が強調されます。
Jon Krohn によって作成された他の資料 (書籍Deep Learning Illustratedや彼の 18 時間のビデオ シリーズDeep Learning with TensorFlow、Keras、および PyTorch など)と同様に、シリーズのコンテンツは次の組み合わせによって実現されます。
プログラミング: すべてのコード デモは Python で行われるため、Python または別のオブジェクト指向プログラミング言語の経験があると、コード例を理解するのに役立ちます。 Python を始めるのに適した (そして無料の) リソースは、Al Sweigart の Automate the Boring Stuff です。
数学: 中学校レベルの数学に精通していると、授業についていくのが容易になります。グラフを理解したり、単純な方程式を並べ替えたりするなど、定量的な情報を扱うことに慣れている場合は、すべての数学を理解するための十分な準備ができている必要があります。このML Foundationsカリキュラムに取り組むときに数学のギャップがあることに気付いた場合は、それらのギャップを埋めるために無料の包括的なカーン アカデミーをお勧めします。
最後に、素晴らしいアーティストの Aglaé Bassens が作成した、 Machine Learning Foundations のマスコットであるオーボエのイラストを以下に示します。