Siraj Raval が提案した 100 日間の機械学習コーディング
ここからデータセットを取得します
ここからコードを確認してください。
ここからコードを確認してください。
ここからコードを確認してください。
今日は #100DaysOfMLCode に進み、ロジスティック回帰とは実際には何なのか、そしてその背後に含まれる数学は何なのかをさらに深く掘り下げました。コスト関数の計算方法と、予測誤差を最小限に抑えるために勾配降下法アルゴリズムをコスト関数に適用する方法を学習しました。
時間が少ないため、隔日でインフォグラフィックを投稿することになります。また、誰かがコードのドキュメンテーションで私を助けたいと思っていて、すでにその分野での経験があり、github の Markdown を知っている場合は、LinkedIn で私に連絡してください :) 。
ここでコードをチェックしてください
#100DaysOfMLCode ロジスティック回帰に関する洞察を明確にするために、インターネットでリソースや記事を探していたところ、Saishruthi Swaminathan によるこの記事 (https://towardsdatascience.com/logistic-regression-detailed-overview-46c4da4303bc) を見つけました。
ロジスティック回帰について詳しく説明します。ぜひチェックしてみてください。
SVM とは何か、そしてそれを分類問題の解決にどのように使用するかについて直感的に理解しました。
SVM の仕組みと K-NN アルゴリズムの実装について詳しく学びました。
分類のために K-NN アルゴリズムを実装しました。 #100DaysOfMLCode サポート ベクター マシンのインフォグラフィックが半分完成しました。明日更新します。
#100DaysOfMLCode に引き続き、今日は Naive Bayes 分類器について説明しました。また、scikit-learn を使用して Python で SVM を実装しています。すぐにコードを更新します。
今日は線形関連データに SVM を実装しました。 Scikit-Learn ライブラリを使用しました。 Scikit-Learn には、このタスクを達成するために使用する SVC 分類器があります。次回の実装ではカーネルトリックを使用する予定です。ここでコードを確認してください。
さまざまなタイプの単純ベイズ分類器について学びました。ブルームバーグによる講演会も開始。プレイリストの最初の 1 つは Black Box Machine Learning でした。予測関数、特徴抽出、学習アルゴリズム、パフォーマンス評価、相互検証、サンプル バイアス、非定常性、過学習、ハイパーパラメーター調整に関する全体の概要を示します。
Scikit-Learn ライブラリを使用すると、データ ポイントを高次元にマッピングして最適な超平面を見つけるカーネル関数とともに SVM アルゴリズムが実装されました。
第 1 週と第 2 週を 1 日で完了しました。ロジスティック回帰をニューラルネットワークとして学習しました。
ディープラーニング専門コース1を修了。 Pythonでニューラルネットを実装しました。
Yaser Abu-Mostafa 教授によるカリフォルニア工科大学の機械学習コース - CS 156 の 18 講義中 1 講義を開始しました。基本的には今後の講義の紹介でした。パーセプトロンアルゴリズムについても解説しました。
ディープ ニューラル ネットワークの改善の第 1 週目: ハイパーパラメーターの調整、正則化、最適化を完了しました。
モデルを構築するためのデータを収集するために、Beautiful Soup を使用して Web スクレイピングを行う方法に関するいくつかのチュートリアルを視聴しました。
カリフォルニア工科大学の機械学習コース - CS 156 の 18 講義中 2 講義 (Yaser Abu-Mostafa 教授による)。ヘフディングの不等式について学びました。
ブルームバーグ ML コースのレク 3 では、入力空間、アクション空間、結果空間、予測関数、損失関数、仮説空間などの中核となる概念のいくつかを紹介しました。
ここでコードを確認してください。
YouTube 3Blue1Brown で素晴らしいチャンネルを見つけました。 Essence of Linear Algebra というプレイリストがあります。まず、ベクトル、線形結合、スパン、基底ベクトル、線形変換、行列乗算の完全な概要を説明する 4 つのビデオを完了することから始めました。
プレイリストへのリンクはこちらから。
プレイリストを続けて完了した次の 4 つのビデオでは、3D 変換、行列式、逆行列、列空間、ヌル空間、非正方行列のトピックについて説明しています。
プレイリストへのリンクはこちらから。
3Blue1Brown のプレイリストでは、線形代数の本質に関するさらに 3 つのビデオが完成しました。取り上げられたトピックは内積と外積です。
プレイリストへのリンクはこちらから。
今日、プレイリスト全体、ビデオ 12 ~ 14 を完了しました。線形代数の概念を一新するための本当に素晴らしいプレイリストです。取り上げられたトピックは、基底の変更、固有ベクトルと固有値、および抽象ベクトル空間でした。
プレイリストへのリンクはこちらから。
3blue1brown のプレイリスト - 線形代数のエッセンスを完成させると、同じチャンネル 3Blue1Brown による一連のビデオに関する提案が YouTube からポップアップされました。線形代数に関する以前のシリーズにすでに感銘を受けていたので、私はすぐにこのシリーズに飛び込みました。デリバティブ、チェーン ルール、積ルール、指数関数のデリバティブなどのトピックに関する約 5 つのビデオを完了しました。
プレイリストへのリンクはこちらから。
プレイリスト Essence of Calculus の Implicit Diffrentiation と Limits に関する 2 本のビデオを視聴しました。
プレイリストへのリンクはこちらから。
積分や高次導関数などのトピックをカバーする残りの 4 つのビデオを視聴しました。
プレイリストへのリンクはこちらから。
ここでコードを確認してください。
3Blue1Brown YouTube チャンネルによるニューラル ネットワークに関する素晴らしいビデオ。このビデオでは、ニューラル ネットワークをよく理解し、手書きの数字データセットを使用して概念を説明します。ビデオへのリンク。
3Blue1Brown YouTube チャンネルによるニューラル ネットワークのパート 2。このビデオでは、勾配降下法の概念を興味深い方法で説明しています。 169 は必見であり、強くお勧めします。ビデオへのリンク。
3Blue1Brown YouTube チャンネルによるニューラル ネットワークのパート 3。このビデオでは主に偏導関数と逆伝播について説明します。ビデオへのリンク。
3Blue1Brown YouTube チャンネルによるニューラル ネットワークのパート 4。ここでの目標は、バックプロパゲーションがどのように機能するかについての直観を、やや正式な用語で表現することです。ビデオ moslty では、偏導関数とバックプロパゲーションについて説明しています。ビデオへのリンク。
ビデオへのリンク。
ビデオへのリンク。
ビデオへのリンク。
ビデオへのリンク。
教師なし学習に移り、クラスタリングについて勉強しました。私のウェブサイトで作業中です。avikdain.me をチェックしてください。K - 平均クラスタリングを簡単に理解するのに役立つ素晴らしいアニメーションも見つかりました。リンク
K Mean クラスタリングを実装しました。ここでコードを確認してください。
JK VanderPlas による新しい本「Python Data Science HandBook」を入手しました。ここで Jupyter ノートブックを確認してください。
第 2 章「Numpy の概要」から始まります。データ型、Numpy 配列、Numpy 配列の計算などのトピックを取り上げました。
コードを確認してください -
NumPy の概要
Python のデータ型を理解する
NumPy 配列の基本
NumPy 配列の計算: ユニバーサル関数
第 2 章 : 集計、比較、ブロードキャスト
ノートブックへのリンク:
集計: 最小値、最大値、およびその間のすべて
配列の計算: ブロードキャスト
比較、マスク、およびブール論理
第 2 章 : 派手なインデックス作成、配列の並べ替え、構造化データ
ノートブックへのリンク:
派手なインデックス作成
配列のソート
構造化データ: NumPy の構造化配列
第 3 章: Pandas を使用したデータ操作
Pandas オブジェクト、データのインデックス付けと選択、データの操作、欠落データの処理、階層型インデックス付け、ConCat、Append などのさまざまなトピックを取り上げます。
ノートブックへのリンク:
Pandas を使用したデータ操作
Pandas オブジェクトの紹介
データのインデックス作成と選択
Pandas でのデータの操作
欠損データの処理
階層型インデックス作成
データセットの結合: 連結と追加
第 3 章: マージと結合、集計とグループ化、ピボット テーブルのトピックを完了しました。
データセットの結合: マージと結合
集約とグループ化
ピボットテーブル
第 3 章: ベクトル化された文字列操作、時系列の操作
ノートブックへのリンク:
ベクトル化された文字列操作
時系列の操作
高性能パンダ: eval() と query()
第 4 章: Matplotlib による視覚化 単純な線プロット、単純な散布図、密度および等高線プロットについて学びました。
ノートブックへのリンク:
Matplotlib による視覚化
単純な線プロット
単純な散布図
エラーの視覚化
密度と等高線プロット
第 4 章: Matplotlib による視覚化 ヒストグラム、プロットの凡例、カラーバー、および複数のサブプロットの構築をカスタマイズする方法について学びました。
ノートブックへのリンク:
ヒストグラム、ビニング、および密度
プロット凡例のカスタマイズ
カラーバーのカスタマイズ
複数のサブプロット
テキストと注釈
第 4 章: Mathplotlib での 3 次元プロットについて説明します。
ノートブックへのリンク:
Matplotlib での 3 次元プロット
階層的クラスタリングについて勉強しました。この素晴らしいビジュアライゼーションをご覧ください。