Sobre modelos de estatísticas
statsmodels é um pacote Python que fornece um complemento ao scipy para cálculos estatísticos, incluindo estatísticas descritivas e estimativa e inferência para modelos estatísticos.
Documentação
A documentação da versão mais recente está em
https://www.statsmodels.org/stable/
A documentação para a versão de desenvolvimento está em
https://www.statsmodels.org/dev/
Melhorias recentes são destacadas nas notas de lançamento
https://www.statsmodels.org/stable/release/
Backups da documentação estão disponíveis em https://statsmodels.github.io/stable/ e https://statsmodels.github.io/dev/.
Principais recursos
- Modelos de regressão linear:
- Mínimos quadrados comuns
- Mínimos quadrados generalizados
- Mínimos quadrados ponderados
- Mínimos quadrados com erros autoregressivos
- Regressão quantílica
- Mínimos quadrados recursivos
- Modelo Linear Misto com efeitos mistos e componentes de variância
- GLM: Modelos lineares generalizados com suporte para todas as distribuições da família exponencial de um parâmetro
- GLM Bayesiano Misto para Binomial e Poisson
- GEE: Equações de estimativa generalizada para dados unidirecionais agrupados ou longitudinais
- Modelos discretos:
- Logit e Probit
- Logit multinomial (MNLogit)
- Regressão de Poisson e Poisson generalizada
- Regressão binomial negativa
- Modelos de contagem inflacionada de zero
- RLM: Modelos lineares robustos com suporte para vários estimadores-M.
- Análise de séries temporais: modelos para análise de séries temporais
- Estrutura completa de modelagem StateSpace
- Modelos sazonais ARIMA e ARIMAX
- Modelos VARMA e VARMAX
- Modelos de fator dinâmico
- Modelos de componentes não observados
- Modelos de comutação de Markov (MSAR), também conhecidos como Modelos Ocultos de Markov (HMM)
- Análise univariada de série temporal: AR, ARIMA
- Modelos autoregressivos vetoriais, VAR e VAR estrutural
- Modelo vetorial de correção de erros, VECM
- suavização exponencial, Holt-Winters
- Testes de hipóteses para séries temporais: raiz unitária, cointegração e outros
- Estatísticas descritivas e modelos de processos para análise de séries temporais
- Análise de sobrevivência:
- Regressão de riscos proporcionais (modelos de Cox)
- Estimativa da função sobrevivente (Kaplan-Meier)
- Estimativa da função de incidência cumulativa
- Multivariado:
- Análise de Componentes Principais com dados faltantes
- Análise Fatorial com rotação
- MANOVA
- Correlação Canônica
- Estatísticas não paramétricas: estimadores de densidade de kernel univariados e multivariados
- Conjuntos de dados: conjuntos de dados usados para exemplos e testes
- Estatísticas: uma ampla gama de testes estatísticos
- diagnósticos e testes de especificação
- testes de adequação e normalidade
- funções para vários testes
- vários testes estatísticos adicionais
- Imputação com MICE, regressão na estatística de ordem e imputação gaussiana
- Análise de mediação
- Os gráficos incluem funções de plotagem para análise visual de dados e resultados do modelo
- E/S
- Ferramentas para leitura de arquivos Stata .dta, mas o pandas tem uma versão mais recente
- Saída da tabela para ascii, latex e html
- Modelos diversos
- Sandbox: statsmodels contém uma pasta sandbox com código em vários estágios de desenvolvimento e teste que não é considerado "pronto para produção". Isto abrange, entre outros
- Estimadores do método generalizado de momentos (GMM)
- Regressão do kernel
- Várias extensões para scipy.stats.distributions
- Modelos de dados de painel
- Medidas teóricas da informação
Como conseguir
O branch principal do GitHub é o código mais atualizado
https://www.github.com/statsmodels/statsmodels
O download da fonte das tags de lançamento está disponível no GitHub
https://github.com/statsmodels/statsmodels/tags
Binários e distribuições de origem estão disponíveis no PyPi
https://pypi.org/project/statsmodels/
Binários podem ser instalados no Anaconda
conda instalar modelos de estatísticas
Obtendo o código mais recente
Instalando a roda noturna mais recente
A roda noturna mais recente pode ser instalada usando pip.
python -m pip install -i https://pypi.anaconda.org/scientific-python-nightly-wheels/simple statsmodels --upgrade --use-deprecated=legacy-resolver
Instalando a partir de fontes
Consulte INSTALL.txt para requisitos ou consulte a documentação
https://statsmodels.github.io/dev/install.html
Contribuindo
Contribuições em qualquer formato são bem-vindas, incluindo:
- Melhorias na documentação
- Testes adicionais
- Novos recursos para modelos existentes
- Novos modelos
https://www.statsmodels.org/stable/dev/test_notes
para obter instruções sobre como instalar modelos estatísticos no modo editável .
Licença
BSD modificado (3 cláusulas)
Discussão e Desenvolvimento
As discussões acontecem na lista de discussão
https://groups.google.com/group/pystatsmodels
e no rastreador de problemas. Estamos muito interessados em feedback sobre usabilidade e sugestões de melhorias.
Relatórios de bugs
Relatórios de bugs podem ser enviados para o rastreador de problemas em
https://github.com/statsmodels/statsmodels/issues