yellowbrickダウンロード - yellowbrickソースコードのダウンロード

yellowbrick

パイソン

Version 1.5

ダウンロード

イエローブリック

ビルドステータス

機械学習モデルの選択を容易にする視覚的な分析および診断ツール。

バナー

イエローブリックとは何ですか?

Yellowbrick は、scikit-learn API を拡張してモデル選択プロセスを人間が操作できるようにする「Visualizers」と呼ばれる視覚的診断ツールのスイートです。一言で言えば、Yellowbrick は scikit-learn ドキュメントの最良の伝統に従って、scikit-learn と matplotlib を組み合わせていますが、機械学習ワークフローの視覚化を生成するためのものです。

Yellowbrick API に関する完全なドキュメント、利用可能なビジュアライザーのギャラリー、寄稿者ガイド、チュートリアルと教育リソース、よくある質問などについては、www.scikit-yb.org のドキュメントを参照してください。

イエローブリックのインストール

Yellowbrick は Python 3.4 以降と互換性があり、scikit-learn および matplotlib にも依存します。 Yellowbrick とその依存関係をインストールする最も簡単な方法は、Python の推奨パッケージインストーラーである pip を使用して PyPI から行うことです。

 $ pip install yellowbrick

Yellowbrick はアクティブなプロジェクトであり、より多くのビジュアライザーとアップデートを含む新しいリリースを定期的に公開していることに注意してください。 Yellowbrick を最新バージョンにアップグレードするには、次のように pip を使用します。

 $ pip install -U yellowbrick

-Uフラグを使用して、scikit-learn、matplotlib、または Yellowbrick と適切に連携するその他のサードパーティユーティリティを最新バージョンに更新することもできます。

Anaconda (Windows ユーザーに推奨) を使用している場合は、conda ユーティリティを利用して Yellowbrick をインストールできます。

 conda install -c districtdatalabs yellowbrick

イエローブリックの使用

Yellowbrick API は、scikit-learn とうまく連携できるように特別に設計されています。以下は、scikit-learn と Yellowbrick を使用した一般的なワークフローシーケンスの例です。

機能の視覚化

この例では、Rank2D が特定のメトリックまたはアルゴリズムを使用してデータセット内の各特徴のペアごとの比較を実行し、それらを左下の三角図としてランク付けして返す方法を示します。

 from yellowbrick . features import Rank2D

visualizer = Rank2D (
    features = features , algorithm = 'covariance'
)
visualizer . fit ( X , y )                # Fit the data to the visualizer
visualizer . transform ( X )             # Transform the data
visualizer . show ()                   # Finalize and render the figure

モデルの視覚化

この例では、scikit-learn 分類器をインスタンス化し、Yellowbrick の ROCAUC クラスを使用して分類器の感度と特異性の間のトレードオフを視覚化します。

 from sklearn . svm import LinearSVC
from yellowbrick . classifier import ROCAUC

model = LinearSVC ()
visualizer = ROCAUC ( model )
visualizer . fit ( X , y )
visualizer . score ( X , y )
visualizer . show ()

Yellowbrick の使用を開始するための追加情報については、ドキュメントのクイックスタートガイドを参照し、サンプルノートブックを確認してください。

イエローブリックへの貢献

Yellowbrick は、プロジェクトへの貢献をありがたく謙虚に受け入れてくれるコミュニティによってサポートされているオープンソースプロジェクトです。大なり小なり、貢献は大きな違いを生みます。これまでオープンソースプロジェクトに貢献したことがない場合は、ぜひ Yellowbrick から始めてください。

貢献に興味がある場合は、貢献者ガイドをご覧ください。ビジュアライザーの作成以外にも、貢献する方法は数多くあります。

GitHub Issues でバグレポートまたは機能リクエストを送信してください。
Jupyter ノートブックをサンプルギャラリーに投稿してください。
ユーザーテストにご協力ください。
ドキュメントに追加するか、Web サイト scikit-yb.org のヘルプを参照してください。
プロジェクトの単体テストまたは統合テストを作成します。
私たちの問題、メーリングリスト、スタックオーバーフローなどに関する質問に答えてください。
ドキュメントを別の言語に翻訳してください。
ブログ投稿を書いたり、ツイートしたり、プロジェクトを他の人と共有したりしてください。
Yellowbrick の使い方を誰かに教えてください。

ご覧のとおり、参加する方法はたくさんあります。ぜひご参加ください。私たちが求める唯一のことは、Python Software Foundation の行動規範に記載されているオープンさ、敬意、他者への配慮の原則を遵守していただくことです。

詳細については、リポジトリのルートにあるCONTRIBUTING.mdファイルを確認するか、Yellowbrick への貢献にある詳細ドキュメントを確認してください。

イエローブリックデータセット

Yellowbrick を使用すると、ドキュメントやテストの例に使用されるいくつかのデータセットに簡単にアクセスできます。これらのデータセットは CDN でホストされており、使用するにはダウンロードする必要があります。通常、ユーザーがデータローダー関数の 1 つ (たとえば、 load_bikeshare()など) を呼び出すと、データがユーザーのコンピューター上にない場合は、データが自動的にダウンロードされます。ただし、開発やテストの場合、またはインターネットアクセスなしで作業することがわかっている場合は、すべてのデータを一度にダウンロードする方が簡単な場合があります。

データダウンローダースクリプトは次のように実行できます。

 $ python -m yellowbrick.download

これにより、Yellowbrick サイトパッケージ内のフィクスチャディレクトリにデータがダウンロードされます。ダウンロードの場所は、ダウンローダースクリプトの引数として指定するか (詳細については--helpを使用)、または$YELLOWBRICK_DATA環境変数を設定することで指定できます。これは、Yellowbrick でのデータのロード方法にも影響するため、これが推奨されるメカニズムです。

注: v1.0 より前の Yellowbrick バージョンからデータをダウンロードした開発者は、古いデータ形式で問題が発生する可能性があります。この問題が発生した場合は、次のようにしてデータキャッシュをクリアできます。

 $ python -m yellowbrick.download --cleanup

これにより、古いデータセットが削除され、新しいデータセットがダウンロードされます。 --no-downloadフラグを使用して、データを再ダウンロードせずに単純にキャッシュをクリアすることもできます。データセットに問題があるユーザーはこれを使用することも、 pip使用して Yellowbrick をアンインストールして再インストールすることもできます。