這個儲存庫以(免費!)Jupyter 筆記本的形式包含整個 Python 資料科學手冊。
線上閱讀本書全文:https://jakevdp.github.io/PythonDataScienceHandbook/
使用此儲存庫的筆記本目錄中提供的 Jupyter 筆記本運行程式碼。
使用 Google Colab 啟動這些筆記本的可執行版本:
使用活頁夾啟動包含這些筆記本的即時筆記型伺服器:
透過 O'Reilly Media 購買印刷版書籍
本書是使用 Python 3.5 編寫和測試的,儘管其他 Python 版本(包括 Python 2.7)應該適用於幾乎所有情況。
本書介紹了在 Python 中處理資料所必需的核心函式庫:特別是 IPython、NumPy、Pandas、Matplotlib、Scikit-Learn 和相關套件。假設您熟悉 Python 語言;如果您需要快速介紹該語言本身,請參閱免費的配套專案「Python 旋風之旅」:這是針對研究人員和科學家的 Python 語言的快速介紹。
請參閱 Index.ipynb 以取得可與文字一起使用的筆記本的索引。
書中的程式碼使用 Python 3.5 進行了測試,儘管大多數(但不是全部)也可以在 Python 2.7 和其他較舊的 Python 版本中正常運作。
我用來運行書中程式碼的套件列在requirements.txt中(請注意,其中一些確切的版本號碼可能在您的平台上不可用:您可能需要調整它們以供自己使用)。若要使用 conda 安裝要求,請在命令列中執行以下命令:
$ conda install --file requirements.txt
若要使用 Python 3.5 和所有必要的套件版本建立名為PDSH
的獨立環境,請執行下列命令:
$ conda create -n PDSH python=3.5 --file requirements.txt
您可以在 conda 文件的管理環境部分中閱讀有關使用 conda 環境的更多資訊。
此儲存庫中的程式碼(包括上面列出的筆記本中的所有程式碼範例)是根據 MIT 許可證發布的。在開源計劃中了解更多。
本書的文字內容是在 CC-BY-NC-ND 授權下發布的。在知識共享上閱讀更多內容。