HypEx (гипотезы и эксперименты) — это комплексная библиотека, созданная для оптимизации процессов причинно-следственных выводов и AB-тестирования при анализе данных. Разработанный для эффективности и действенности, HypEx использует причинную модель Рубина (RCM) для сопоставления близкородственных пар, обеспечивая справедливое сравнение групп при оценке эффектов лечения.
Обладая полностью автоматизированным конвейером, HypEx умело рассчитывает средний эффект лечения (ATE), средний эффект лечения на обработанном (ATT) и средний эффект лечения на контроле (ATC). Он предлагает стандартизированный интерфейс для выполнения этих оценок, предоставляя представление о влиянии вмешательств на различные подгруппы населения.
Помимо причинно-следственных выводов, HypEx оснащен надежными инструментами тестирования AB, включая методы «Разница в разностях» (Diff-in-Diff) и CUPED, для тщательной проверки гипотез и проверки экспериментальных результатов.
Некоторые функции HypEx могут облегчить решение конкретных вспомогательных задач, но не могут автоматизировать решения по планированию эксперимента. Ниже мы обсудим функции, которые реализованы в HypEx, но не автоматизируют планирование экспериментов.
Примечание. Для сопоставления рекомендуется не использовать более 7 признаков, так как это может привести к проклятию размерности и сделать результаты нерепрезентативными.
Выбор признаков моделирует значимость признаков для точности целевой аппроксимации. Однако это не исключает возможности упустить из виду функции, сложное влияние функций на целевое описание или значимость функций с точки зрения бизнес-логики. Алгоритм не будет работать корректно, если произойдут утечки данных.
На что следует обратить внимание при выборе функций:
Ссылка на ReadTheDocs
Алгоритм случайного лечения случайным образом перемешивает фактическое лечение. Ожидается, что эффект лечения на цель будет близок к 0.
Эти методы не являются достаточно точным показателем успешного эксперимента.
Ссылка на ReadTheDocs
pip install -U hypex
Ознакомьтесь с примерами использования и учебными пособиями здесь.
from hypex import Matcher
from hypex . utils . tutorial_data_creation import create_test_data
# Define your data and parameters
df = create_test_data ( rs = 42 , na_step = 45 , nan_cols = [ 'age' , 'gender' ])
info_col = [ 'user_id' ]
outcome = 'post_spends'
treatment = 'treat'
model = Matcher ( input_data = df , outcome = outcome , treatment = treatment , info_col = info_col )
results , quality_results , df_matched = model . estimate ()
from hypex import AATest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
info_cols = [ 'user_id' , 'signup_month' ]
target = [ 'post_spends' , 'pre_spends' ]
experiment = AATest ( info_cols = info_cols , target_fields = target )
results = experiment . process ( data , iterations = 1000 )
results . keys ()
from hypex import ABTest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
model = ABTest ()
results = model . execute (
data = data ,
target_field = 'post_spends' ,
target_field_before = 'pre_spends' ,
group_field = 'group'
)
model . show_beautiful_result ()
Для получения более подробной информации о библиотеке и ее функциях посетите нашу документацию на ReadTheDocs.
Вы найдете подробные руководства и учебные пособия, которые помогут вам начать работу с HypEx, а также подробную документацию по API для расширенных вариантов использования.
Присоединяйтесь к нашему динамичному сообществу! Рекомендации по участию, сообщению о проблемах или обращению за поддержкой можно найти в наших Правилах по участию.
Хабр (ru) — узнайте, как HypEx совершает революцию в причинно-следственной связи в различных областях.
Семинар по A/B-тестированию - Семинар в NoML о сопоставлении и A/B-тестировании
Сопоставление с HypEx: Простое руководство – Простое руководство с объяснением
Сопоставление с HypEx: Группировка – Сопоставление с руководством по группировке
HypEx против причинно-следственной связи и DoWhy — узнайте, почему HypEx — лучшее решение для причинно-следственной связи
HypEx против причинно-следственной связи и DoWhy: часть 2 – узнайте, почему HypEx — лучшее решение для причинно-следственной связи
Посетите этот блокнот на Kaggle и оцените результаты самостоятельно.
Размер группы | 32 768 | 65 536 | 131 072 | 262 144 | 524 288 | 1 048 576 | 2 097 152 | 4 194 304 |
---|---|---|---|---|---|---|---|---|
Причинный вывод | 46 с | 169 с | Никто | Никто | Никто | Никто | Никто | Никто |
ДелатьПочему | 9 с | 19 с | 40-е годы | 77-е | 159 с | 312 с | 615 с | 1 235 с |
HypEx с группировкой | 2 с | 6 с | 16 с | 42 секунды | 167 с | 509 с | 1 932 с. | 7 248 с |
HypEx без группировки | 2 с | 7 с | 21 с | 101 с | 273 с | 982-е | 3 750 с | 14 720 с |
Есть вопросы или хотите обсудить HypEx? Присоединяйтесь к нашему чату Telegram и общайтесь с сообществом и разработчиками.
HypEx является незаменимым ресурсом для аналитиков данных и исследователей, занимающихся причинно-следственными выводами и AB-тестированием. Благодаря своим автоматизированным возможностям, сложным методам сопоставления и тщательным процедурам проверки HypEx способен раскрывать причинно-следственные связи в сложных наборах данных с беспрецедентной скоростью и точностью.