HypEx (الفرضيات والتجارب) هي مكتبة شاملة مصممة لتبسيط الاستدلال السببي وعمليات اختبار AB في تحليلات البيانات. تم تطوير HypEx لتحقيق الكفاءة والفعالية، ويستخدم نموذج روبن السببي (RCM) لمطابقة الأزواج ذات الصلة الوثيقة، مما يضمن مقارنات جماعية عادلة عند تقدير تأثيرات العلاج.
تتميز HypEx بخط أنابيب مؤتمت بالكامل، وتقوم بحساب متوسط تأثير العلاج (ATE)، ومتوسط تأثير العلاج على المعالج (ATT)، ومتوسط تأثير العلاج على التحكم (ATC). وهو يوفر واجهة موحدة لتنفيذ هذه التقديرات، وتوفير رؤى حول تأثير التدخلات عبر مختلف المجموعات السكانية الفرعية.
وبعيدًا عن الاستدلال السببي، تم تجهيز HypEx بأدوات اختبار AB القوية، بما في ذلك الفرق في الاختلافات ( Diff-in-Diff) وطرق CUPED، لاختبار الفرضيات بدقة والتحقق من صحة النتائج التجريبية.
يمكن لبعض الوظائف في HypEx تسهيل حل مهام مساعدة محددة ولكن لا يمكنها أتمتة القرارات المتعلقة بتصميم التجربة. سنناقش أدناه الميزات التي يتم تنفيذها في HypEx ولكنها لا تعمل على أتمتة تصميم التجارب.
ملحوظة: بالنسبة للمطابقة، يوصى بعدم استخدام أكثر من 7 ميزات لأن ذلك قد يؤدي إلى لعنة الأبعاد، مما يجعل النتائج غير تمثيلية.
يمثل اختيار الميزة أهمية الميزات في دقة تقريب الهدف. ومع ذلك، فإنه لا يستبعد إمكانية تجاهل الميزات، أو التأثير المعقد للميزات على وصف الهدف، أو أهمية الميزات من منظور منطق الأعمال. لن تعمل الخوارزمية بشكل صحيح في حالة حدوث تسرب للبيانات.
النقاط التي يجب مراعاتها عند اختيار الميزات:
رابط إلى ReadTheDocs
تعمل خوارزمية المعالجة العشوائية على خلط المعالجة الفعلية بشكل عشوائي. ومن المتوقع أن يكون تأثير العلاج على الهدف قريبًا من 0.
هذه الطريقة ليست علامة دقيقة بما فيه الكفاية لتجربة ناجحة.
رابط إلى ReadTheDocs
pip install -U hypex
استكشف أمثلة الاستخدام والبرامج التعليمية هنا.
from hypex import Matcher
from hypex . utils . tutorial_data_creation import create_test_data
# Define your data and parameters
df = create_test_data ( rs = 42 , na_step = 45 , nan_cols = [ 'age' , 'gender' ])
info_col = [ 'user_id' ]
outcome = 'post_spends'
treatment = 'treat'
model = Matcher ( input_data = df , outcome = outcome , treatment = treatment , info_col = info_col )
results , quality_results , df_matched = model . estimate ()
from hypex import AATest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
info_cols = [ 'user_id' , 'signup_month' ]
target = [ 'post_spends' , 'pre_spends' ]
experiment = AATest ( info_cols = info_cols , target_fields = target )
results = experiment . process ( data , iterations = 1000 )
results . keys ()
from hypex import ABTest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
model = ABTest ()
results = model . execute (
data = data ,
target_field = 'post_spends' ,
target_field_before = 'pre_spends' ,
group_field = 'group'
)
model . show_beautiful_result ()
لمزيد من المعلومات التفصيلية حول المكتبة وميزاتها، قم بزيارة وثائقنا على ReadTheDocs.
ستجد أدلة وبرامج تعليمية شاملة ستساعدك على البدء في استخدام HypEx، بالإضافة إلى وثائق API التفصيلية لحالات الاستخدام المتقدمة.
انضم إلى مجتمعنا النابض بالحياة! للحصول على إرشادات حول المساهمة أو الإبلاغ عن المشكلات أو طلب الدعم، يرجى الرجوع إلى إرشادات المساهمة الخاصة بنا.
حبر (ru) - اكتشف كيف تُحدث HypEx ثورة في الاستدلال السببي في مختلف المجالات.
ندوة اختبار A/B - ندوة في NoML حول المطابقة واختبار A/B
المطابقة مع HypEx: دليل بسيط - دليل مطابقة بسيط مع الشرح
المطابقة مع HypEx: التجميع - المطابقة مع دليل التجميع
HypEx مقابل الاستدلال السببي وDoHY - اكتشف لماذا يعتبر HypEx هو الحل الأفضل للاستدلال السببي
HypEx مقابل الاستدلال السببي وDoHY: الجزء 2 - اكتشف لماذا يعتبر HypEx هو الحل الأفضل للاستدلال السببي
قم بزيارة هذا الدفتر عين كاجل وقم بتقدير النتائج بنفسك.
حجم المجموعة | 32768 | 65536 | 131072 | 262 144 | 524288 | 1 048 576 | 2 097 152 | 4194304 |
---|---|---|---|---|---|---|---|---|
الاستدلال السببي | 46 ثانية | 169 ثانية | لا أحد | لا أحد | لا أحد | لا أحد | لا أحد | لا أحد |
افعل لماذا | 9ث | 19 ثانية | الأربعينيات | 77 ثانية | 159 ثانية | 312 ثانية | 615 ثانية | 1235ث |
HypEx مع التجميع | 2 ثانية | 6 ثانية | 16 ثانية | 42 ثانية | 167 ثانية | 509 ثانية | 1932ث | 7248ث |
HypEx بدون تجميع | 2 ثانية | 7ث | 21 ثانية | 101 ثانية | 273 ثانية | 982 ثانية | 3750 ثانية | 14720 ثانية |
هل لديك أسئلة أو ترغب في مناقشة HypEx؟ انضم إلى دردشة Telegram وتواصل مع المجتمع والمطورين.
يعد HypEx بمثابة مورد لا غنى عنه لمحللي البيانات والباحثين الذين يتعمقون في الاستدلال السببي واختبار AB. بفضل قدراتها الآلية وتقنيات المطابقة المتطورة وإجراءات التحقق الشاملة، تستعد HypEx لكشف العلاقات السببية في مجموعات البيانات المعقدة بسرعة ودقة غير مسبوقتين.