À propos des modèles de statistiques
statsmodels est un package Python qui fournit un complément à scipy pour les calculs statistiques, y compris les statistiques descriptives ainsi que l'estimation et l'inférence pour les modèles statistiques.
Documentation
La documentation de la dernière version se trouve à
https://www.statsmodels.org/stable/
La documentation de la version de développement est à
https://www.statsmodels.org/dev/
Les améliorations récentes sont mises en évidence dans les notes de version
https://www.statsmodels.org/stable/release/
Des sauvegardes de la documentation sont disponibles sur https://statsmodels.github.io/stable/ et https://statsmodels.github.io/dev/.
Principales caractéristiques
- Modèles de régression linéaire :
- Moindres carrés ordinaires
- Moindres carrés généralisés
- Moindres carrés pondérés
- Moindres carrés avec erreurs autorégressives
- Régression quantile
- Moindres carrés récursifs
- Modèle linéaire mixte avec effets mixtes et composantes de variance
- GLM : modèles linéaires généralisés prenant en charge toutes les distributions familiales exponentielles à un paramètre
- GLM mixte bayésien pour binôme et Poisson
- GEE : équations d'estimation généralisées pour les données groupées ou longitudinales unidirectionnelles
- Modèles discrets :
- Logit et Probit
- Logit multinomial (MNLogit)
- Régression de Poisson et Poisson généralisée
- Régression binomiale négative
- Modèles à comptage zéro
- RLM : modèles linéaires robustes avec prise en charge de plusieurs M-estimateurs.
- Analyse des séries chronologiques : modèles pour l'analyse des séries chronologiques
- Cadre de modélisation StateSpace complet
- Modèles saisonniers ARIMA et ARIMAX
- Modèles VARMA et VARMAX
- Modèles de facteurs dynamiques
- Modèles de composants non observés
- Modèles de commutation de Markov (MSAR), également connus sous le nom de modèles de Markov cachés (HMM)
- Analyse de séries chronologiques univariées : AR, ARIMA
- Modèles vectoriels autorégressifs, VAR et VAR structurel
- Modèle de correction d'erreurs vectorielles, VECM
- lissage exponentiel, Holt-Winters
- Tests d'hypothèses pour les séries temporelles : racine unitaire, cointégration et autres
- Statistiques descriptives et modèles de processus pour l'analyse de séries chronologiques
- Analyse de survie :
- Régression à risques proportionnels (modèles Cox)
- Estimation de la fonction de survivant (Kaplan-Meier)
- Estimation de la fonction d'incidence cumulative
- Multivarié :
- Analyse en composantes principales avec données manquantes
- Analyse Factorielle avec rotation
- MANOVA
- Corrélation canonique
- Statistiques non paramétriques : estimateurs de densité de noyau univariés et multivariés
- Ensembles de données : ensembles de données utilisés à titre d'exemple et lors des tests
- Statistiques : une large gamme de tests statistiques
- tests de diagnostic et de spécification
- tests d'ajustement et de normalité
- fonctions pour plusieurs tests
- divers tests statistiques complémentaires
- Imputation avec MICE, régression sur statistique d'ordre et imputation gaussienne
- Analyse de médiation
- Les graphiques incluent des fonctions de tracé pour l'analyse visuelle des données et des résultats du modèle
- E/S
- Outils de lecture des fichiers Stata .dta, mais pandas a une version plus récente
- Sortie du tableau en ascii, latex et html
- Modèles divers
- Sandbox : statsmodels contient un dossier sandbox avec du code à différentes étapes de développement et de test qui n'est pas considéré comme "prêt pour la production". Cela couvre entre autres
- Estimateurs de la méthode des moments généralisés (GMM)
- Régression du noyau
- Diverses extensions de scipy.stats.distributions
- Modèles de données de panel
- Mesures théoriques de l’information
Comment l'obtenir
La branche principale sur GitHub est le code le plus à jour
https://www.github.com/statsmodels/statsmodels
Le téléchargement source des balises de version est disponible sur GitHub
https://github.com/statsmodels/statsmodels/tags
Les binaires et les distributions sources sont disponibles sur PyPi
https://pypi.org/project/statsmodels/
Les binaires peuvent être installés dans Anaconda
conda installer des modèles de statistiques
Obtenir le dernier code
Installation de la roue de nuit la plus récente
La roue nocturne la plus récente peut être installée à l'aide de pip.
python -m pip install -i https://pypi.anaconda.org/scientific-python-nightly-wheels/simple statsmodels --upgrade --use-deprecated=legacy-resolver
Installation à partir des sources
Voir INSTALL.txt pour connaître les exigences ou consulter la documentation
https://statsmodels.github.io/dev/install.html
Contribuer
Les contributions sous quelque forme que ce soit sont les bienvenues, notamment :
- Améliorations de la documentation
- Tests supplémentaires
- Nouvelles fonctionnalités sur les modèles existants
- Nouveaux modèles
https://www.statsmodels.org/stable/dev/test_notes
pour obtenir des instructions sur l’installation de statsmodels en mode modifiable .
Licence
BSD modifié (3 clauses)
Discussion et développement
Les discussions ont lieu sur la liste de diffusion
https://groups.google.com/group/pystatsmodels
et dans le suivi des problèmes. Nous sommes très intéressés par les commentaires sur la convivialité et les suggestions d’amélioration.
Rapports de bogues
Les rapports de bogues peuvent être soumis au système de suivi des problèmes à l'adresse
https://github.com/statsmodels/statsmodels/issues