pip install numpy
)pip install pandas
)pip install scikit-learn
)pip install scipy
)pip install statsmodels
)pip install matplotlib
)pip install seaborn
)pip install sympy
)pip install flask
)pip install wtforms
)pip install tensorflow>=1.15
)pip install keras
)pip install pdpipe
)Heartbeat マガジン (Medium プラットフォーム) に私が書いたこの記事から始めることができます。
NumPy、Pandans、Seaborn、Matplotlib などのトピックに関する幅広い関数と操作をカバーする Jupyter ノートブック。
Python で線形回帰を実行する複数の方法とその速度の比較 (freeCodeCamp で私が書いた記事を確認してください)
正則化を使用した多変量回帰
scikit-learn パイプライン機能を使用した多項式回帰 (データサイエンスに向けて私が書いた記事を確認してください)
デシジョン ツリーとランダム フォレスト回帰 (ランダム フォレストが過学習を拒否する堅牢な/正規化されたメタ推定量としてどのように機能するかを示します)
線形回帰問題に対する詳細な視覚的分析と適合度診断テスト
Scikit-learn のHuberRegressor
を使用した堅牢な線形回帰
k -最近傍分類 (これがノートブックです)
ディシジョン ツリーとランダム フォレスト分類 (ノートブックはこちら)
ベクター マシンの分類をサポートします (これがノートブックです) ( SVM とソート アルゴリズムに関するデータ サイエンスに向けて私が書いた記事を確認してください)
K平均クラスタリング (これがノートブックです)
親和性の伝播 (時間計算量と減衰係数の効果を示す) (これがノートブックです)
平均値シフト手法 (時間計算量とクラスター発見に対するノイズの影響を示す) (これがノートブックです)
DBSCAN (クラスターの形状に関係なく、一般的に高密度領域を検出できる方法を示していますが、K 平均法では検出できません) (これがノートブックです)
最適なクラスター数を選択する方法を示す樹状図を使用した階層的クラスタリング (これはノートブックです)
Sympy パッケージを使用して、シンボリック数式を使用してランダム データセットを生成する方法。
このトピックに関する Medium の記事は次のとおりです: シンボリック式を使用したランダム回帰および分類問題の生成
シンプルな HTTP サーバー インターフェイスを通じて線形回帰モデルを提供します。ユーザーは Python スクリプトを実行して予測をリクエストする必要があります。 Flask
とGunicorn
使用します。
Web フォームを備えた HTTP Web ページを通じてリカレント ニューラル ネットワーク (RNN) を提供します。ユーザーはパラメーターを入力し、ボタンをクリックして、事前トレーニングされた RNN モデルに基づいてテキストを生成できます。 Flask
、 Jinja
、 Keras
/ TensorFlow
、 WTForms
を使用します。
独自の Scikit-learn に似た推定器を構築し、それを改良することで、機械学習のコンテキストで中心的な OOP 原則の一部を実装します。
このトピックに関する Medium の記事を参照してください。
Pytest ディレクトリ内のファイルと詳細な手順を確認して、機械学習モデルの単体テスト コード/モジュールを作成する方法を理解してください。
メモリ フットプリントとコンピューティング時間に関するデータ サイエンス コードと ML モデルのプロファイリングは、重要ですが、やりすぎになることが多い領域です。ここにアイデアを示したノートブックがいくつかあります。