このリポジトリには、Python データ サイエンス ハンドブック全体が (無料!) Jupyter ノートブックの形式で含まれています。
https://jakevdp.github.io/PythonDataScienceHandbook/ でこの本の全文をオンラインで読んでください。
このリポジトリのノートブック ディレクトリにある Jupyter ノートブックを使用してコードを実行します。
Google Colab を使用して、これらのノートブックの実行可能バージョンを起動します。
バインダーを使用して、これらのノートブックでライブ ノートブック サーバーを起動します。
O'Reilly Media から印刷された書籍を購入する
この本は Python 3.5 で書かれ、テストされていますが、他の Python バージョン (Python 2.7 を含む) もほぼすべてのケースで動作するはずです。
この本では、Python でデータを操作するために不可欠なコア ライブラリ、特に IPython、NumPy、Pandas、Matplotlib、Scikit-Learn、および関連パッケージを紹介します。言語としての Python に精通していることが前提となります。この言語自体について簡単に説明する必要がある場合は、無料のコンパニオン プロジェクトである Python の旋風ツアーを参照してください。これは、研究者や科学者を対象とした、ペースの速い Python 言語の入門です。
テキストに添付できるノートブックのインデックスについては、Index.ipynb を参照してください。
この本のコードは Python 3.5 でテストされていますが、ほとんど (すべてではありません) は Python 2.7 やその他の古い Python バージョンでも正しく動作します。
この本のコードを実行するために使用したパッケージは、requirements.txt にリストされています (これらの正確なバージョン番号の一部は、お使いのプラットフォームでは利用できない場合があることに注意してください。場合によっては、独自の使用のために調整する必要があるかもしれません)。 conda を使用して要件をインストールするには、コマンドラインで次のコマンドを実行します。
$ conda install --file requirements.txt
Python 3.5 と必要なすべてのパッケージ バージョンを使用してPDSH
という名前のスタンドアロン環境を作成するには、次のコマンドを実行します。
$ conda create -n PDSH python=3.5 --file requirements.txt
conda 環境の使用について詳しくは、conda ドキュメントの「環境の管理」セクションをご覧ください。
このリポジトリ内のコードは、上記のノートブック内のすべてのコード サンプルを含め、MIT ライセンスに基づいてリリースされています。詳細については、オープンソース イニシアチブをご覧ください。
この本のテキスト コンテンツは、CC-BY-NC-ND ライセンスに基づいて公開されています。詳細については、クリエイティブ コモンズをご覧ください。