Essai | |
Emballer | |
Méta |
pandas est un package Python qui fournit des structures de données rapides, flexibles et expressives conçues pour rendre le travail avec des données « relationnelles » ou « étiquetées » à la fois simple et intuitif. Il vise à être l’élément fondamental de haut niveau pour effectuer une analyse de données pratique et réelle en Python. De plus, il a pour objectif plus large de devenir l’outil d’analyse/manipulation de données open source le plus puissant et le plus flexible disponible dans n’importe quelle langue . Il est déjà en bonne voie pour atteindre cet objectif.
Principales caractéristiques
Où l'obtenir
Dépendances
Installation à partir des sources
Licence
Documentation
Arrière-plan
Obtenir de l'aide
Discussion et développement
Contribuer aux pandas
Voici quelques-unes des choses que les pandas font bien :
Gestion facile des données manquantes (représentées par NaN
, NA
ou NaT
) en virgule flottante ainsi que des données en virgule non flottante
Mutabilité de taille : les colonnes peuvent être insérées et supprimées du DataFrame et des objets de dimension supérieure
Alignement automatique et explicite des données : les objets peuvent être explicitement alignés sur un ensemble d'étiquettes, ou l'utilisateur peut simplement ignorer les étiquettes et laisser Series
, DataFrame
, etc. aligner automatiquement les données pour vous dans les calculs
Fonctionnalité de regroupement puissante et flexible pour effectuer des opérations de fractionnement, d'application et de combinaison sur des ensembles de données, à la fois pour l'agrégation et la transformation des données.
Facilitez la conversion de données irrégulières et indexées différemment dans d'autres structures de données Python et NumPy en objets DataFrame
Découpage intelligent basé sur des étiquettes, indexation sophistiquée et sous-ensembles de grands ensembles de données
Fusion et jonction intuitives d'ensembles de données
Remodelage et pivotement flexibles des ensembles de données
Étiquetage hiérarchique des axes (possibilité d'avoir plusieurs étiquettes par tick)
Outils d'E/S robustes pour charger des données à partir de fichiers plats (CSV et délimités), de fichiers Excel , de bases de données et sauvegarder/charger des données à partir du format ultra-rapide HDF5
Fonctionnalités spécifiques aux séries chronologiques : génération de plages de dates et conversion de fréquence, statistiques de fenêtres mobiles, décalage et retard de date
Le code source est actuellement hébergé sur GitHub à l'adresse : https://github.com/pandas-dev/pandas
Les installateurs binaires pour la dernière version publiée sont disponibles sur Python Package Index (PyPI) et sur Conda.
# condaconda install -c conda-forge pandas
# ou PyPIpip installe les pandas
La liste des modifications apportées aux pandas entre chaque version peut être trouvée ici. Pour plus de détails, consultez les journaux de validation sur https://github.com/pandas-dev/pandas.
NumPy - Ajoute la prise en charge de grands tableaux multidimensionnels, de matrices et de fonctions mathématiques de haut niveau pour fonctionner sur ces tableaux.
python-dateutil - Fournit des extensions puissantes au module datetime standard
pytz - Intégre la base de données Olson tz dans Python, ce qui permet des calculs de fuseau horaire précis et multiplateformes
Consultez les instructions d'installation complètes pour connaître les versions minimales prises en charge des dépendances obligatoires, recommandées et facultatives.
Pour installer des pandas à partir des sources, vous avez besoin de Cython en plus des dépendances normales ci-dessus. Cython peut être installé depuis PyPI :
pip installer cython
Dans le répertoire pandas
(le même que celui où vous avez trouvé ce fichier après avoir cloné le dépôt git), exécutez :
pip installer.
ou pour une installation en mode développement :
python -m pip install -ve . --no-build-isolation -Ceditable-verbose=true
Consultez les instructions complètes pour l’installation à partir des sources.
BSD3
La documentation officielle est hébergée sur PyData.org.
Les travaux sur pandas
ont commencé chez AQR (un fonds spéculatif quantitatif) en 2008 et se développent activement depuis lors.
Pour les questions d'utilisation, le meilleur endroit où aller est StackOverflow. De plus, des questions et discussions générales peuvent également avoir lieu sur la liste de diffusion pydata.
La plupart des discussions de développement ont lieu sur GitHub dans ce dépôt, via le système de suivi des problèmes GitHub.
De plus, la liste de diffusion pandas-dev peut également être utilisée pour des discussions spécialisées ou des problèmes de conception, et un canal Slack est disponible pour des questions rapides liées au développement.
Il existe également des réunions communautaires fréquentes pour les responsables du projet, ouvertes à la communauté, ainsi que des réunions mensuelles des nouveaux contributeurs pour aider à soutenir les nouveaux contributeurs.
Des informations supplémentaires sur les canaux de communication sont disponibles sur la page de la communauté des contributeurs.
Toutes les contributions, rapports de bugs, corrections de bugs, améliorations de la documentation, améliorations et idées sont les bienvenus.
Un aperçu détaillé de la manière de contribuer peut être trouvé dans le guide de contribution .
Si vous cherchez simplement à commencer à travailler avec la base de code pandas, accédez à l'onglet « problèmes » de GitHub et commencez à examiner les problèmes intéressants. Un certain nombre de problèmes sont répertoriés sous Docs et un bon premier numéro par lequel vous pouvez commencer.
Vous pouvez également trier les problèmes qui peuvent inclure la reproduction de rapports de bogues ou la demande d'informations vitales telles que les numéros de version ou les instructions de reproduction. Si vous souhaitez commencer à trier les problèmes, un moyen simple de commencer est de vous abonner aux pandas sur CodeTriage.
Ou peut-être qu'en utilisant des pandas, vous avez votre propre idée ou que vous cherchez quelque chose dans la documentation et que vous pensez « cela peut être amélioré »... vous pouvez faire quelque chose à ce sujet !
N'hésitez pas à poser des questions sur la liste de diffusion ou sur Slack.
En tant que contributeurs et responsables de ce projet, vous devez respecter le code de conduite des pandas. Pour plus d'informations, consultez : Code de conduite des contributeurs
Aller en haut