数学を知らない AI 分野で働く人は、説得方法を知らない政治家のようなものです。どちらも取り組むべき避けられない領域があります。
1 週間前、私は 2021 年にデータ サイエンスに参入する方法に関する記事を書きました。それ以来、世界中の人々から、データ サイエンスにどれだけの数学が必要なのかを尋ねるメールを数通受け取りました。
嘘はつきません。これはかなりの数学です。
そしてこれが多くの初心者を遠ざける理由の1つです。多くの調査とこの分野のベテランとの話し合いを経て、知っておくべき数学の基本をすべて網羅したこの実用的なガイドをまとめました。以下で説明する概念は、通常、大学の数学期にわたってカバーされますが、私はそれらを、集中できる中心原則に要約しました。
このガイドは初心者にとって絶対的な命の恩人であり、最も重要なトピックを学ぶことができ、これらの概念を簡単に理解する必要がある私のような実践者にとってはさらに優れたリソースです。
注: データ サイエンスで最初の仕事に就くために、(以下の) 概念をすべて理解する必要はありません。必要なのは、基本をしっかりと理解することだけです。それらに焦点を当てて統合します。
代数の知識はおそらく数学全般の基礎です。加算、減算、乗算、除算などの数学演算に加えて、次のことを知っておく必要があります。
指数
ラジカル
階乗
合計
科学表記法
線形代数は、人工知能および科学と工学の多くの分野における主要な数学計算ツールです。ここでは、4 つの主要な数学的オブジェクトとその特性を理解する必要があります。
スカラー - 単一の数値 (実数または自然数にすることができます)。
ベクトル - 順番に並べられた数字のリスト。これらは、各要素が軸に沿った座標を表す空間内の点であると考えてください。
行列 - 各数値が 2 つのインデックスによって識別される数値の 2 次元配列。
テンソル - N 軸の規則的なグリッド上に配置された数値の ND 配列 (N>2)。機械学習、ディープラーニング、コンピュータービジョンで重要
固有ベクトルと固有値 - 特殊なベクトルとそれに対応するスカラー量。重要性とその見つけ方を理解してください。
特異値分解 - 行列を 3 つの行列に因数分解します。特性と用途を理解します。
主成分分析 (PCA) - 重要性、特性、および用途を理解します。
ドット積、ベクトル積、アダマール積などのプロパティも知っておくと役立ちます。
微積分は、パラメータ、関数、誤差、近似の変化を扱います。データ サイエンスでは、多次元微積分の実用的な知識が不可欠です。以下は、微積分における最も重要な概念です (すべてではありませんが)。
導関数 - ルール (加算、積、連鎖規則など)、双曲線導関数 (tanh、cosh など)、および偏導関数。
ベクトル/行列微積分 - さまざまな微分演算子 (勾配、ヤコビアン、ヘッセ行列、ラプラシアン)
勾配アルゴリズム - ローカル/グローバル最大値と最小値、鞍点、凸関数、バッチとミニバッチ、確率的勾配降下法、パフォーマンス比較。
基本的な統計 - 平均、中央値、最頻値、分散、共分散など
確率の基本ルール - イベント (依存および独立)、サンプル空間、条件付き確率。
確率変数 - 連続および離散、期待値、分散、分布 (結合および条件付き)。
ベイズの定理 - 信念の妥当性を計算します。ベイジアン ソフトウェアは、機械がパターンを認識して意思決定を行うのに役立ちます。
最尤推定 (MLE) - パラメータ推定。基本的な確率概念 (同時確率と事象の独立性) の知識が必要です。
一般的な分布 - 二項分布、ポアソン分布、ベルヌーイ分布、ガウス分布、指数関数。
AIやディープラーニングに大きく貢献してきた重要な分野だが、まだ多くの人に知られていない。これは、微積分、統計、確率を組み合わせたものと考えることができます。
エントロピー - シャノン エントロピーとも呼ばれます。実験の不確かさを測定するために使用されます。
クロスエントロピー - 2 つの確率分布を比較し、それらがどの程度類似しているかを示します。
Kullback Leibler Divergence - 2 つの確率分布がどの程度類似しているかを示すもう 1 つの尺度です。
ビタビ アルゴリズム - 自然言語処理 (NLP) と音声で広く使用されています
エンコーダ/デコーダ - 機械翻訳 RNN およびその他のモデルで使用されます。
人工知能では数学が非常に重要です。それがなければ、それは魂のない人間の体に匹敵します。数学的概念を従量課金制として扱うことができます。異質な概念が現れるたびに、それをつかみ、貪り食ってください。上記のガイドは、AI のあらゆる種類のトピックや概念を理解するための、最小限でありながら包括的なリソースを提供します。
幸運を!
このロードマップを改善できると思われる場合は、更新情報を記載した PR を開いて問題を送信してください。私たちはこれを改善し続けるので、将来このリポジトリを再訪問するために、このリポジトリを監視したりスターを付けたりすることを検討することをお勧めします。
ロードマップを更新する方法については、コントリビューション ガイドをご覧ください。
改善を加えたプルリクエストを開く
問題のアイデアについて話し合う
言葉を広めてください
フィードバックをお寄せください
このロードマップは Jason Dsouza によって作成され、MIT ライセンスに基づいて公開されています。