О статистических моделях
statsmodels — это пакет Python, который дополняет scipy для статистических вычислений, включая описательную статистику, а также оценку и вывод для статистических моделей.
Документация
Документация для последней версии находится по адресу
https://www.statsmodels.org/stable/
Документация для разрабатываемой версии находится по адресу
https://www.statsmodels.org/dev/
Последние улучшения описаны в примечаниях к выпуску.
https://www.statsmodels.org/stable/release/
Резервные копии документации доступны по адресу https://statsmodels.github.io/stable/ и https://statsmodels.github.io/dev/.
Основные характеристики
- Модели линейной регрессии:
- Обычные наименьшие квадраты
- Обобщенные наименьшие квадраты
- Взвешенные наименьшие квадраты
- Метод наименьших квадратов с ошибками авторегрессии
- Квантильная регрессия
- Рекурсивный метод наименьших квадратов
- Смешанная линейная модель со смешанными эффектами и компонентами отклонения.
- GLM: обобщенные линейные модели с поддержкой всех однопараметрических экспоненциальных распределений семейства.
- Байесовский смешанный GLM для бинома и Пуассона
- GEE: обобщенные уравнения оценки для односторонних кластерных или продольных данных.
- Дискретные модели:
- Логит и Пробит
- Полиномиальный логит (MNLogit)
- Пуассон и обобщенная регрессия Пуассона
- Отрицательная биномиальная регрессия
- Модели с нулевым завышенным счетом
- RLM: надежные линейные модели с поддержкой нескольких M-оценщиков.
- Анализ временных рядов: модели для анализа временных рядов
- Полная структура моделирования StateSpace
- Сезонные модели ARIMA и ARIMAX
- Модели ВАРМА и ВАРМАКС
- Модели динамического фактора
- Модели ненаблюдаемых компонентов
- Модели марковского переключения (MSAR), также известные как скрытые марковские модели (HMM)
- Одномерный анализ временных рядов: AR, ARIMA
- Векторные модели авторегрессии, VAR и структурная VAR
- Модель векторного исправления ошибок, VECM
- экспоненциальное сглаживание, Холт-Винтерс
- Проверка гипотез для временных рядов: единичный корень, коинтеграция и другие.
- Описательная статистика и модели процессов для анализа временных рядов
- Анализ выживания:
- Регрессия пропорциональных рисков (модели Кокса)
- Оценка функции выживаемости (Каплана-Мейера)
- Оценка функции совокупной заболеваемости
- Многовариантность:
- Анализ главных компонентов с отсутствующими данными
- Факторный анализ с ротацией
- МАНОВА
- Каноническая корреляция
- Непараметрическая статистика: одномерные и многомерные оценки плотности ядра
- Наборы данных: наборы данных, используемые для примеров и при тестировании.
- Статистика: широкий спектр статистических тестов
- диагностика и технические испытания
- тесты на согласие и нормальность
- функции для многократного тестирования
- различные дополнительные статистические тесты
- Вменение с помощью MICE, регрессия по статистике порядка и вменение по Гауссу.
- Медиационный анализ
- Графика включает функции построения графиков для визуального анализа данных и результатов модели.
- ввод/вывод
- Инструменты для чтения файлов Stata .dta, но у pandas есть более свежая версия
- Вывод таблицы в ascii, latex и html
- Разные модели
- Песочница: statsmodels содержит папку песочницы с кодом, находящимся на различных стадиях разработки и тестирования, который не считается «готовым к производству». Это охватывает среди прочего
- Оценщики обобщенного метода моментов (GMM)
- Регрессия ядра
- Различные расширения для scipy.stats.distributions
- Модели панельных данных
- Теоретико-информационные меры
Как это получить
Основная ветка на GitHub — это самый актуальный код.
https://www.github.com/statsmodels/statsmodels
Загрузка исходного кода тегов выпуска доступна на GitHub.
https://github.com/statsmodels/statsmodels/tags
Двоичные файлы и дистрибутивы исходного кода доступны на PyPi.
https://pypi.org/project/statsmodels/
Бинарные файлы можно установить в Anaconda.
Conda устанавливает статистические модели
Получение последней версии кода
Установка самого последнего ночного колеса
Самое последнее ночное колесо можно установить с помощью pip.
python -m pip install -i https://pypi.anaconda.org/scientific-python-nightly-wheels/simple statsmodels --upgrade --use-deprecated=legacy-resolver
Установка из исходников
Требования см. в INSTALL.txt или в документации.
https://statsmodels.github.io/dev/install.html
Содействие
Приветствуются вклады в любой форме, в том числе:
- Улучшения документации
- Дополнительные тесты
- Новые функции существующих моделей
- Новые модели
https://www.statsmodels.org/stable/dev/test_notes
инструкции по установке statsmodels в редактируемом режиме.
Лицензия
Модифицированный BSD (3 пункта)
Обсуждение и развитие
Обсуждения проходят в списке рассылки
https://groups.google.com/group/pystatsmodels
и в трекере проблем. Нам очень интересны отзывы об удобстве использования и предложения по улучшениям.
Отчеты об ошибках
Отчеты об ошибках можно отправлять в систему отслеживания проблем по адресу:
https://github.com/statsmodels/statsmodels/issues