HypEx (Hypotheses and Experiments) ist eine umfassende Bibliothek, die darauf ausgelegt ist, die Kausalinferenz- und AB-Testprozesse in der Datenanalyse zu optimieren. HypEx wurde im Hinblick auf Effizienz und Effektivität entwickelt und verwendet Rubins Kausalmodell (RCM), um eng verwandte Paare abzugleichen und so gerechte Gruppenvergleiche bei der Abschätzung der Behandlungseffekte sicherzustellen.
HypEx verfügt über eine vollautomatische Pipeline und berechnet geschickt den durchschnittlichen Behandlungseffekt (ATE), den durchschnittlichen Behandlungseffekt bei den Behandelten (ATT) und den durchschnittlichen Behandlungseffekt bei der Kontrolle (ATC). Es bietet eine standardisierte Schnittstelle zur Durchführung dieser Schätzungen und liefert Einblicke in die Auswirkungen von Interventionen auf verschiedene Bevölkerungsuntergruppen.
Über die kausale Schlussfolgerung hinaus ist HypEx mit robusten AB-Testtools ausgestattet, darunter Difference-in-Differences (Diff-in-Diff) und CUPED-Methoden, um Hypothesen gründlich zu testen und experimentelle Ergebnisse zu validieren.
Einige Funktionen in HypEx können die Lösung spezifischer Hilfsaufgaben erleichtern, Entscheidungen zum Experimentdesign jedoch nicht automatisieren. Im Folgenden besprechen wir Funktionen, die in HypEx implementiert sind, aber die Versuchsplanung nicht automatisieren.
Hinweis: Für Matching wird empfohlen, nicht mehr als 7 Features zu verwenden, da dies zu einem Fluch der Dimensionalität führen und die Ergebnisse nicht mehr repräsentativ machen könnte.
Die Merkmalsauswahl modelliert die Bedeutung von Merkmalen für die Genauigkeit der Zielnäherung. Es schließt jedoch nicht die Möglichkeit übersehener Merkmale, den komplexen Einfluss von Merkmalen auf die Zielbeschreibung oder die Bedeutung von Merkmalen aus Sicht der Geschäftslogik aus. Bei Datenlecks funktioniert der Algorithmus nicht richtig.
Bei der Auswahl von Funktionen zu berücksichtigende Punkte:
Link zu ReadTheDocs
Der Zufallsbehandlungsalgorithmus mischt die tatsächliche Behandlung zufällig. Es wird erwartet, dass die Wirkung der Behandlung auf das Ziel nahe bei 0 liegt.
Diese Methode ist kein ausreichend genauer Indikator für ein erfolgreiches Experiment.
Link zu ReadTheDocs
pip install -U hypex
Entdecken Sie hier Anwendungsbeispiele und Tutorials.
from hypex import Matcher
from hypex . utils . tutorial_data_creation import create_test_data
# Define your data and parameters
df = create_test_data ( rs = 42 , na_step = 45 , nan_cols = [ 'age' , 'gender' ])
info_col = [ 'user_id' ]
outcome = 'post_spends'
treatment = 'treat'
model = Matcher ( input_data = df , outcome = outcome , treatment = treatment , info_col = info_col )
results , quality_results , df_matched = model . estimate ()
from hypex import AATest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
info_cols = [ 'user_id' , 'signup_month' ]
target = [ 'post_spends' , 'pre_spends' ]
experiment = AATest ( info_cols = info_cols , target_fields = target )
results = experiment . process ( data , iterations = 1000 )
results . keys ()
from hypex import ABTest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
model = ABTest ()
results = model . execute (
data = data ,
target_field = 'post_spends' ,
target_field_before = 'pre_spends' ,
group_field = 'group'
)
model . show_beautiful_result ()
Ausführlichere Informationen zur Bibliothek und ihren Funktionen finden Sie in unserer Dokumentation auf ReadTheDocs.
Sie finden umfassende Anleitungen und Tutorials, die Ihnen den Einstieg in HypEx erleichtern, sowie eine detaillierte API-Dokumentation für fortgeschrittene Anwendungsfälle.
Treten Sie unserer lebendigen Community bei! Richtlinien zum Mitwirken, Melden von Problemen oder zum Anfordern von Unterstützung finden Sie in unseren Beitragsrichtlinien.
Habr (ru) – Entdecken Sie, wie HypEx die kausale Schlussfolgerung in verschiedenen Bereichen revolutioniert.
A/B-Testing-Seminar – Seminar in NoML über Matching und A/B-Testing
Matching mit HypEx: Einfache Anleitung – Einfache Matching-Anleitung mit Erklärung
Matching mit HypEx: Gruppierung – Matching mit Gruppierungsleitfaden
HypEx vs. kausale Inferenz und DoWhy – entdecken Sie, warum HypEx die beste Lösung für kausale Inferenz ist
HypEx vs. kausale Inferenz und DoWhy: Teil 2 – Entdecken Sie, warum HypEx die beste Lösung für kausale Inferenz ist
Besuchen Sie dieses Notizbuch von Kaggle und schätzen Sie die Ergebnisse selbst ein.
Gruppengröße | 32 768 | 65 536 | 131 072 | 262 144 | 524 288 | 1 048 576 | 2 097 152 | 4 194 304 |
---|---|---|---|---|---|---|---|---|
Kausalschluss | 46er | 169er | Keiner | Keiner | Keiner | Keiner | Keiner | Keiner |
Warum | 9er | 19er Jahre | 40er Jahre | 77er | 159er | 312s | 615s | 1 235s |
HypEx mit Gruppierung | 2s | 6s | 16s | 42s | 167s | 509er | 1 932s | 7 248s |
HypEx ohne Gruppierung | 2s | 7s | 21er Jahre | 101s | 273s | 982er Jahre | 3 750er | 14 720er |
Haben Sie Fragen oder möchten Sie über HypEx diskutieren? Nehmen Sie an unserem Telegram-Chat teil und vernetzen Sie sich mit der Community und den Entwicklern.
HypEx ist eine unverzichtbare Ressource für Datenanalysten und Forscher, die sich mit kausalen Schlussfolgerungen und AB-Tests befassen. Mit seinen automatisierten Funktionen, ausgefeilten Matching-Techniken und gründlichen Validierungsverfahren ist HypEx in der Lage, kausale Zusammenhänge in komplexen Datensätzen mit beispielloser Geschwindigkeit und Präzision aufzudecken.