Acerca de los modelos de estadísticas
statsmodels es un paquete de Python que proporciona un complemento a scipy para cálculos estadísticos que incluyen estadísticas descriptivas y estimación e inferencia para modelos estadísticos.
Documentación
La documentación de la última versión está en
https://www.statsmodels.org/stable/
La documentación para la versión de desarrollo está en
https://www.statsmodels.org/dev/
Las mejoras recientes se destacan en las notas de la versión.
https://www.statsmodels.org/stable/release/
Las copias de seguridad de la documentación están disponibles en https://statsmodels.github.io/stable/ y https://statsmodels.github.io/dev/.
Características principales
- Modelos de regresión lineal:
- Mínimos cuadrados ordinarios
- Mínimos cuadrados generalizados
- Mínimos cuadrados ponderados
- Mínimos cuadrados con errores autorregresivos
- Regresión cuantil
- Mínimos cuadrados recursivos
- Modelo lineal mixto con efectos mixtos y componentes de varianza
- GLM: modelos lineales generalizados compatibles con todas las distribuciones familiares exponenciales de un parámetro
- GLM mixto bayesiano para binomial y Poisson
- GEE: Ecuaciones de estimación generalizadas para datos longitudinales o agrupados unidireccionales
- Modelos discretos:
- Logit y Probit
- Logit multinomial (MNLogit)
- Poisson y regresión de Poisson generalizada
- Regresión binomial negativa
- Modelos de recuento inflado cero
- RLM: Modelos lineales robustos con soporte para varios estimadores M.
- Análisis de series de tiempo: modelos para análisis de series de tiempo
- Marco de modelado completo de StateSpace
- Modelos ARIMA y ARIMAX de temporada
- Modelos VARMA y VARMAX
- Modelos de factores dinámicos
- Modelos de componentes no observados
- Modelos de conmutación de Markov (MSAR), también conocidos como modelos ocultos de Markov (HMM)
- Análisis univariante de series temporales: AR, ARIMA
- Modelos vectoriales autorregresivos, VAR y VAR estructural
- Modelo de corrección de errores vectoriales, VECM
- suavizado exponencial, Holt-Winters
- Pruebas de hipótesis para series de tiempo: raíz unitaria, cointegración y otras
- Estadísticas descriptivas y modelos de procesos para análisis de series temporales.
- Análisis de supervivencia:
- Regresión de riesgos proporcionales (modelos de Cox)
- Estimación de la función de supervivencia (Kaplan-Meier)
- Estimación de la función de incidencia acumulada
- Multivariado:
- Análisis de componentes principales con datos faltantes
- Análisis factorial con rotación
- MANOVA
- Correlación canónica
- Estadística no paramétrica: estimadores de densidad de kernel univariados y multivariados
- Conjuntos de datos: conjuntos de datos utilizados para ejemplos y pruebas.
- Estadísticas: una amplia gama de pruebas estadísticas
- pruebas de diagnóstico y especificaciones
- pruebas de bondad de ajuste y normalidad
- funciones para pruebas múltiples
- varias pruebas estadísticas adicionales
- Imputación con MICE, regresión sobre estadística de orden e imputación gaussiana
- Análisis de mediación
- Los gráficos incluyen funciones de trazado para el análisis visual de datos y resultados del modelo.
- E/S
- Herramientas para leer archivos Stata .dta, pero pandas tiene una versión más reciente
- Salida de tabla a ascii, latex y html
- Varios modelos
- Sandbox: statsmodels contiene una carpeta sandbox con código en varias etapas de desarrollo y prueba que no se considera "listo para producción". Esto cubre entre otros
- Estimadores del método generalizado de momentos (GMM)
- regresión del núcleo
- Varias extensiones para scipy.stats.distributions
- Modelos de datos de paneles
- Medidas teóricas de la información.
como conseguirlo
La rama principal de GitHub es el código más actualizado.
https://www.github.com/statsmodels/statsmodels
La descarga del código fuente de las etiquetas de lanzamiento está disponible en GitHub
https://github.com/statsmodels/statsmodels/tags
Los binarios y las distribuciones de fuentes están disponibles en PyPi.
https://pypi.org/project/statsmodels/
Los binarios se pueden instalar en Anaconda
conda instalar modelos de estadísticas
Obteniendo el código más reciente
Instalación de la rueda nocturna más reciente
La rueda nocturna más reciente se puede instalar usando pip.
python -m pip install -i https://pypi.anaconda.org/scientific-python-nightly-wheels/simple statsmodels --upgrade --use-deprecated=legacy-resolver
Instalación desde fuentes
Consulte INSTALL.txt para conocer los requisitos o consulte la documentación.
https://statsmodels.github.io/dev/install.html
Contribuyendo
Se aceptan contribuciones de cualquier forma, incluidas:
- Mejoras en la documentación
- Pruebas adicionales
- Nuevas características de los modelos existentes.
- Nuevos modelos
https://www.statsmodels.org/stable/dev/test_notes
para obtener instrucciones sobre cómo instalar statsmodels en modo editable .
Licencia
BSD modificado (3 cláusulas)
Discusión y desarrollo
Las discusiones se llevan a cabo en la lista de correo.
https://groups.google.com/group/pystatsmodels
y en el rastreador de problemas. Estamos muy interesados en recibir comentarios sobre la usabilidad y sugerencias de mejora.
Informes de errores
Los informes de errores se pueden enviar al rastreador de problemas en
https://github.com/statsmodels/statsmodels/issues