HypEx (Hypotheses and Experiments) es una biblioteca integral diseñada para optimizar los procesos de inferencia causal y pruebas AB en el análisis de datos. Desarrollado para lograr eficiencia y eficacia, HypEx emplea el modelo causal de Rubin (RCM) para emparejar pares estrechamente relacionados, asegurando comparaciones de grupos equitativas al estimar los efectos del tratamiento.
Con un proceso totalmente automatizado, HypEx calcula hábilmente el efecto promedio del tratamiento (ATE), el efecto promedio del tratamiento en los tratados (ATT) y el efecto promedio del tratamiento en el control (ATC). Ofrece una interfaz estandarizada para ejecutar estas estimaciones, proporcionando información sobre el impacto de las intervenciones en varios subgrupos de población.
Más allá de la inferencia causal, HypEx está equipado con sólidas herramientas de prueba AB, incluidos los métodos de diferencia en diferencias (Diff-in-Diff) y CUPED, para probar hipótesis rigurosamente y validar resultados experimentales.
Algunas funciones de HypEx pueden facilitar la resolución de tareas auxiliares específicas, pero no pueden automatizar decisiones sobre el diseño de experimentos. A continuación, analizaremos las funciones que se implementan en HypEx pero que no automatizan el diseño de experimentos.
Nota: Para la coincidencia, se recomienda no utilizar más de 7 funciones, ya que podría provocar la maldición de la dimensionalidad y hacer que los resultados no sean representativos.
La selección de características modela la importancia de las características para la precisión de la aproximación del objetivo. Sin embargo, no descarta la posibilidad de que se pasen por alto características, el impacto complejo de las características en la descripción del objetivo o la importancia de las características desde una perspectiva de lógica empresarial. El algoritmo no funcionará correctamente si hay fugas de datos.
Puntos a considerar al seleccionar funciones:
Enlace a ReadTheDocs
El algoritmo de tratamiento aleatorio mezcla aleatoriamente el tratamiento real. Se espera que el efecto del tratamiento sobre el objetivo sea cercano a 0.
Este método no es un marcador suficientemente preciso de un experimento exitoso.
Enlace a ReadTheDocs
pip install -U hypex
Explore ejemplos de uso y tutoriales aquí.
from hypex import Matcher
from hypex . utils . tutorial_data_creation import create_test_data
# Define your data and parameters
df = create_test_data ( rs = 42 , na_step = 45 , nan_cols = [ 'age' , 'gender' ])
info_col = [ 'user_id' ]
outcome = 'post_spends'
treatment = 'treat'
model = Matcher ( input_data = df , outcome = outcome , treatment = treatment , info_col = info_col )
results , quality_results , df_matched = model . estimate ()
from hypex import AATest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
info_cols = [ 'user_id' , 'signup_month' ]
target = [ 'post_spends' , 'pre_spends' ]
experiment = AATest ( info_cols = info_cols , target_fields = target )
results = experiment . process ( data , iterations = 1000 )
results . keys ()
from hypex import ABTest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
model = ABTest ()
results = model . execute (
data = data ,
target_field = 'post_spends' ,
target_field_before = 'pre_spends' ,
group_field = 'group'
)
model . show_beautiful_result ()
Para obtener información más detallada sobre la biblioteca y sus características, visite nuestra documentación en ReadTheDocs.
Encontrará guías y tutoriales completos que lo ayudarán a comenzar con HypEx, así como documentación API detallada para casos de uso avanzados.
¡Únase a nuestra vibrante comunidad! Para obtener pautas sobre cómo contribuir, informar problemas o buscar ayuda, consulte nuestras Pautas de contribución.
Habr (ru): descubra cómo HypEx está revolucionando la inferencia causal en varios campos.
Seminario de pruebas A/B - Seminario en NoML sobre emparejamiento y pruebas A/B
Emparejamiento con HypEx: Guía simple - Guía de emparejamiento simple con explicación
Emparejamiento con HypEx: Agrupación - Emparejamiento con guía de agrupación
HypEx vs Causal Inference y DoWhy: descubra por qué HypEx es la mejor solución para la inferencia causal
HypEx vs Inferencia causal y DoWhy: parte 2: descubra por qué HypEx es la mejor solución para la inferencia causal
Visite este cuaderno en Kaggle y calcule los resultados usted mismo.
Tamaño del grupo | 32 768 | 65 536 | 131 072 | 262 144 | 524 288 | 1 048 576 | 2 097 152 | 4 194 304 |
---|---|---|---|---|---|---|---|---|
Inferencia causal | 46s | 169s | Ninguno | Ninguno | Ninguno | Ninguno | Ninguno | Ninguno |
hacer por qué | 9s | 19 años | 40 años | 77 | 159s | 312 | 615 | 1 235s |
HypEx con agrupación | 2s | 6s | 16 | 42s | 167s | 509 | 1 932 | 7 248 |
HypEx sin agrupar | 2s | 7s | 21 | 101 | 273s | 982 | 3 750 | 14 720 |
¿Tiene preguntas o quiere hablar sobre HypEx? Únase a nuestro chat de Telegram y conéctese con la comunidad y los desarrolladores.
HypEx se erige como un recurso indispensable para los analistas de datos e investigadores que profundizan en la inferencia causal y las pruebas AB. Con sus capacidades automatizadas, técnicas de comparación sofisticadas y procedimientos de validación exhaustivos, HypEx está preparado para desentrañar relaciones causales en conjuntos de datos complejos con una velocidad y precisión sin precedentes.