HypEx (สมมติฐานและการทดลอง) เป็นไลบรารีที่ครอบคลุมที่สร้างขึ้นเพื่อปรับปรุงกระบวนการอนุมานเชิงสาเหตุและการทดสอบ AB ในการวิเคราะห์ข้อมูล HypEx พัฒนาขึ้นเพื่อประสิทธิภาพและประสิทธิผล โดยใช้ Rubin's Causal Model (RCM) เพื่อจับคู่คู่ที่เกี่ยวข้องกันอย่างใกล้ชิด เพื่อให้มั่นใจว่ามีการเปรียบเทียบกลุ่มที่เท่าเทียมกันเมื่อประมาณผลการรักษา
HypEx นำเสนอไปป์ไลน์อัตโนมัติเต็มรูปแบบในการคำนวณผลการรักษาโดยเฉลี่ย (ATE) ผลการรักษาโดยเฉลี่ยต่อผู้ที่ได้รับการรักษา (ATT) และผลการรักษาโดยเฉลี่ยต่อกลุ่มควบคุม (ATC) อย่างเชี่ยวชาญ โดยนำเสนออินเทอร์เฟซที่เป็นมาตรฐานสำหรับการดำเนินการประมาณค่าเหล่านี้ โดยให้ข้อมูลเชิงลึกเกี่ยวกับผลกระทบของการแทรกแซงในกลุ่มย่อยของประชากรต่างๆ
นอกเหนือจากการอนุมานเชิงสาเหตุ HypEx ยังมีเครื่องมือทดสอบ AB ที่มีประสิทธิภาพ รวมถึงวิธีความแตกต่างในความแตกต่าง (Diff-in-Diff) และ CUPED เพื่อทดสอบสมมติฐานอย่างเข้มงวดและตรวจสอบผลการทดลอง
ฟังก์ชันบางอย่างใน HypEx สามารถอำนวยความสะดวกในการแก้ปัญหางานเสริมเฉพาะ แต่ไม่สามารถทำการตัดสินใจเกี่ยวกับการออกแบบการทดลองได้โดยอัตโนมัติ ด้านล่างนี้ เราจะพูดถึงฟีเจอร์ที่นำมาใช้ใน HypEx แต่ไม่ได้ทำให้การออกแบบการทดลองเป็นแบบอัตโนมัติ
หมายเหตุ: สำหรับการจับคู่ ขอแนะนำว่าอย่าใช้คุณลักษณะมากกว่า 7 รายการ เนื่องจากอาจส่งผลให้เกิดการสาปแช่งมิติ ทำให้ผลลัพธ์ไม่เป็นตัวแทน
การเลือกคุณลักษณะ จะจำลองความสำคัญของคุณลักษณะต่างๆ เพื่อความแม่นยำของการประมาณเป้าหมาย อย่างไรก็ตาม ไม่ได้ตัดความเป็นไปได้ของคุณลักษณะที่ถูกมองข้าม ผลกระทบที่ซับซ้อนของคุณลักษณะในคำอธิบายเป้าหมาย หรือความสำคัญของคุณลักษณะจากมุมมองของตรรกะทางธุรกิจ อัลกอริธึมจะไม่ทำงานอย่างถูกต้องหากมีข้อมูลรั่วไหล
จุดที่ต้องพิจารณาเมื่อเลือกคุณสมบัติ:
ลิงก์ไปยัง ReadTheDocs
อัลกอริธึม การรักษาแบบสุ่ม จะสุ่มสับเปลี่ยนการรักษาจริง คาดว่าผลของการรักษาต่อเป้าหมายจะใกล้เคียงกับ 0
วิธีการเหล่านี้ไม่ใช่ตัวบ่งชี้ความสำเร็จของการทดสอบที่แม่นยำเพียงพอ
ลิงก์ไปยัง ReadTheDocs
pip install -U hypex
สำรวจตัวอย่างการใช้งานและบทช่วยสอนที่นี่
from hypex import Matcher
from hypex . utils . tutorial_data_creation import create_test_data
# Define your data and parameters
df = create_test_data ( rs = 42 , na_step = 45 , nan_cols = [ 'age' , 'gender' ])
info_col = [ 'user_id' ]
outcome = 'post_spends'
treatment = 'treat'
model = Matcher ( input_data = df , outcome = outcome , treatment = treatment , info_col = info_col )
results , quality_results , df_matched = model . estimate ()
from hypex import AATest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
info_cols = [ 'user_id' , 'signup_month' ]
target = [ 'post_spends' , 'pre_spends' ]
experiment = AATest ( info_cols = info_cols , target_fields = target )
results = experiment . process ( data , iterations = 1000 )
results . keys ()
from hypex import ABTest
from hypex . utils . tutorial_data_creation import create_test_data
data = create_test_data ( rs = 52 , na_step = 10 , nan_cols = [ 'age' , 'gender' ])
model = ABTest ()
results = model . execute (
data = data ,
target_field = 'post_spends' ,
target_field_before = 'pre_spends' ,
group_field = 'group'
)
model . show_beautiful_result ()
สำหรับข้อมูลโดยละเอียดเพิ่มเติมเกี่ยวกับไลบรารีและฟีเจอร์ต่างๆ โปรดไปที่เอกสารประกอบของเราใน ReadTheDocs
คุณจะพบคำแนะนำและบทช่วยสอนที่ครอบคลุมซึ่งจะช่วยให้คุณเริ่มต้นใช้งาน HypEx รวมถึงเอกสารประกอบ API โดยละเอียดสำหรับกรณีการใช้งานขั้นสูง
เข้าร่วมชุมชนที่มีชีวิตชีวาของเรา! สำหรับแนวทางในการมีส่วนร่วม การรายงานปัญหา หรือการขอความช่วยเหลือ โปรดดูที่แนวทางการมีส่วนร่วมของเรา
Habr (ru) - ค้นพบว่า HypEx ปฏิวัติการอนุมานเชิงสาเหตุในด้านต่างๆ ได้อย่างไร
สัมมนาการทดสอบ A/B - สัมมนาใน NoML เกี่ยวกับการจับคู่และการทดสอบ A/B
การจับคู่กับ HypEx: Simple Guide - คู่มือการจับคู่อย่างง่ายพร้อมคำอธิบาย
การจับคู่กับ HypEx: การจัดกลุ่ม - การจับคู่พร้อมคำแนะนำการจัดกลุ่ม
HypEx เทียบกับการอนุมานเชิงสาเหตุและเหตุใด - ค้นหาว่าทำไม HypEx จึงเป็นทางออกที่ดีที่สุดสำหรับการอนุมานเชิงสาเหตุ
HypEx เทียบกับการอนุมานเชิงสาเหตุและเหตุใด: ตอนที่ 2 - ค้นหาว่าเหตุใด HypEx จึงเป็นทางออกที่ดีที่สุดสำหรับการอนุมานเชิงสาเหตุ
เยี่ยมชมสมุดบันทึกนี้ใน Kaggle และประเมินผลลัพธ์ด้วยตัวเอง
ขนาดกลุ่ม | 32 768 | 65 536 | 131 072 | 262 144 | 524 288 | 1 048 576 | 2 097 152 | 4 194 304 |
---|---|---|---|---|---|---|---|---|
การอนุมานเชิงสาเหตุ | 46ส | 169ส | ไม่มี | ไม่มี | ไม่มี | ไม่มี | ไม่มี | ไม่มี |
ทำทำไม | 9ส | 19ส | 40s | 77s | 159ส | 312ส | 615ส | 1 235ส |
HypEx พร้อมการจัดกลุ่ม | 2 วินาที | 6ส | 16ส | 42s | 167ส | 509 | 1 932ส | 7 248ส |
HypEx โดยไม่ต้องจัดกลุ่ม | 2 วินาที | 7ส | 21ส | 101ส | 273ส | 982 | 3 750ส | 14 720ส |
มีคำถามหรือต้องการหารือเกี่ยวกับ HypEx? เข้าร่วมแชท Telegram ของเราและเชื่อมต่อกับชุมชนและนักพัฒนา
HypEx ถือเป็นแหล่งข้อมูลที่ขาดไม่ได้สำหรับนักวิเคราะห์ข้อมูลและนักวิจัยที่เจาะลึกเรื่องการอนุมานเชิงสาเหตุและการทดสอบ AB ด้วยความสามารถอัตโนมัติ เทคนิคการจับคู่ที่ซับซ้อน และขั้นตอนการตรวจสอบอย่างละเอียด HypEx จึงพร้อมที่จะคลี่คลายความสัมพันธ์เชิงสาเหตุในชุดข้อมูลที่ซับซ้อนด้วยความเร็วและความแม่นยำที่ไม่เคยมีมาก่อน