Ce référentiel contient l'intégralité du Python Data Science Handbook, sous la forme de notebooks Jupyter (gratuits !).
Lisez le livre dans son intégralité en ligne sur https://jakevdp.github.io/PythonDataScienceHandbook/
Exécutez le code à l'aide des notebooks Jupyter disponibles dans le répertoire notebooks de ce référentiel.
Lancez les versions exécutables de ces notebooks à l'aide de Google Colab :
Lancez un serveur de notebooks en direct avec ces notebooks à l'aide de binder :
Achetez le livre imprimé via O'Reilly Media
Le livre a été écrit et testé avec Python 3.5, bien que d'autres versions de Python (y compris Python 2.7) devraient fonctionner dans presque tous les cas.
Le livre présente les bibliothèques de base essentielles pour travailler avec des données en Python : en particulier IPython, NumPy, Pandas, Matplotlib, Scikit-Learn et les packages associés. Une connaissance de Python en tant que langage est supposée ; si vous avez besoin d'une introduction rapide au langage lui-même, consultez le projet compagnon gratuit, A Whirlwind Tour of Python : il s'agit d'une introduction rapide au langage Python destinée aux chercheurs et aux scientifiques.
Voir Index.ipynb pour un index des cahiers disponibles pour accompagner le texte.
Le code du livre a été testé avec Python 3.5, bien que la plupart (mais pas tous) fonctionnent également correctement avec Python 2.7 et d'autres versions plus anciennes de Python.
Les packages que j'ai utilisés pour exécuter le code dans le livre sont répertoriés dans exigences.txt (notez que certains de ces numéros de version exacts peuvent ne pas être disponibles sur votre plate-forme : vous devrez peut-être les modifier pour votre propre usage). Pour installer la configuration requise à l'aide de conda, exécutez ce qui suit sur la ligne de commande :
$ conda install --file requirements.txt
Pour créer un environnement autonome nommé PDSH
avec Python 3.5 et toutes les versions de package requises, exécutez ce qui suit :
$ conda create -n PDSH python=3.5 --file requirements.txt
Vous pouvez en savoir plus sur l'utilisation des environnements conda dans la section Gestion des environnements de la documentation conda.
Le code de ce référentiel, y compris tous les exemples de code dans les blocs-notes répertoriés ci-dessus, est publié sous la licence MIT. En savoir plus sur l'Initiative Open Source.
Le contenu textuel du livre est publié sous la licence CC-BY-NC-ND. En savoir plus sur Creative Commons.