ดาวน์โหลด numpyro - ดาวน์โหลดซอร์สโค้ด numpyro

numpyro

ซอร์สโค้ดอื่น ๆ

0.15.3

ดาวน์โหลด

numpyro

การเขียนโปรแกรมความน่าจะเป็นขับเคลื่อนโดย JAX สำหรับการรวบรวม Autograd และ JIT ไปยัง GPU/TPU/CPU

เอกสารและตัวอย่าง | ฟอรัม

NUMPYRO คืออะไร?

Numpyro เป็นไลบรารีการเขียนโปรแกรมที่น่าจะเป็นน้ำหนักเบาที่ให้แบ็กเอนด์ Numpy สำหรับ Pyro เราพึ่งพา JAX สำหรับความแตกต่างอัตโนมัติและการรวบรวม JIT ไปยัง GPU / CPU Numpyro อยู่ระหว่างการพัฒนาที่ใช้งานอยู่ดังนั้นระวังความเปราะบางข้อบกพร่องและการเปลี่ยนแปลง API เมื่อการออกแบบวิวัฒนาการ

Numpyro ได้รับการออกแบบให้มี น้ำหนักเบา และมุ่งเน้นไปที่การจัดหาสารตั้งต้นที่ยืดหยุ่นที่ผู้ใช้สามารถสร้างได้:

Pyro Primitives: โปรแกรม NUMPYRO สามารถมีรหัส Python และ NumPy ปกตินอกเหนือจาก Pyro Primitives เช่น sample และ param รหัสโมเดลควรดูคล้ายกับ Pyro มากยกเว้นความแตกต่างเล็กน้อยระหว่าง Pytorch และ API ของ Numpy ดูตัวอย่างด้านล่าง
อัลกอริทึมการอนุมาน: NUMPYRO สนับสนุนอัลกอริธึมการอนุมานจำนวนหนึ่งโดยมุ่งเน้นไปที่อัลกอริทึม MCMC เช่น Hamiltonian Monte Carlo รวมถึงการใช้งานตัวอย่าง No-Turn No-Turn อัลกอริทึม MCMC เพิ่มเติมรวมถึง MixTHMC (ซึ่งสามารถรองรับตัวแปรแฝงที่ไม่ต่อเนื่อง) เช่นเดียวกับ HMCECs (ซึ่งคำนวณความน่าจะเป็นสำหรับชุดย่อยของข้อมูลในการวนซ้ำแต่ละครั้ง) หนึ่งในแรงจูงใจสำหรับ Numpyro คือการเร่งความเร็วให้กับ Hamiltonian Monte Carlo โดย JIT รวบรวม Verlet Integrator ที่มีการคำนวณการไล่ระดับสีหลายครั้ง ด้วย JAX เราสามารถเขียน jit และ grad เพื่อรวบรวมขั้นตอนการรวมทั้งหมดลงในเคอร์เนลที่ปรับให้เหมาะสม XLA นอกจากนี้เรายังกำจัดค่าใช้จ่ายของ Python โดย JIT รวบรวมเวทีการสร้างต้นไม้ทั้งหมดในถั่ว (เป็นไปได้โดยใช้น็อตวนซ้ำ) นอกจากนี้ยังมีการใช้การอนุมานแบบแปรผันขั้นพื้นฐานพร้อมกับคำแนะนำ (อัตโนมัติ) ที่ยืดหยุ่นจำนวนมากสำหรับการอนุมานความแปรปรวนของความแตกต่างอัตโนมัติ (ADVI) การใช้การอนุมานแบบแปรปรวนรองรับคุณสมบัติจำนวนมากรวมถึงการสนับสนุนสำหรับรุ่นที่มีตัวแปรแฝงแบบไม่ต่อเนื่อง (ดู Tracegraph_elbo และ Traceenum_elbo)
การแจกแจง: โมดูล NUMPYRO.Distributions จัดเตรียมคลาสการแจกแจงข้อ จำกัด และการแปลง bijective คลาสการแจกจ่ายจะห่อหุ้มตัวอย่างที่ใช้ในการทำงานกับเครื่องกำเนิดหมายเลขเทียมหลอกฟังก์ชั่นของ JAX การออกแบบโมดูลการแจกแจงส่วนใหญ่ตามมาจาก Pytorch ชุดย่อยที่สำคัญของ API ถูกนำมาใช้และมีการแจกแจงทั่วไปส่วนใหญ่ที่มีอยู่ใน pytorch เป็นผลให้ผู้ใช้ Pyro และ Pytorch สามารถพึ่งพา API และความหมายแบบแบทช์เดียวกันกับใน torch.distributions นอกเหนือจากการแจกแจง constraints และ transforms ยังมีประโยชน์มากเมื่อทำงานในคลาสการแจกจ่ายด้วยการสนับสนุนที่มีขอบเขต ในที่สุดการแจกแจงจากความน่าจะเป็นของ Tensorflow (TFP) สามารถใช้โดยตรงในรุ่น NUMPYRO
ตัวจัดการเอฟเฟกต์: เช่น pyro, primitives เช่น sample และ param สามารถให้การตีความที่ไม่เป็นมาตรฐานโดยใช้ตัวจัดการเอฟเฟกต์จากโมดูล numpyro.handlers และสิ่งเหล่านี้สามารถขยายได้อย่างง่ายดายเพื่อใช้อัลกอริทึมการอนุมานที่กำหนดเองและยูทิลิตี้การอนุมาน

ตัวอย่างง่ายๆ - 8 โรงเรียน

ให้เราสำรวจ numpyro โดยใช้ตัวอย่างง่ายๆ เราจะใช้ตัวอย่างโรงเรียนแปดแห่งจาก Gelman และคณะการวิเคราะห์ข้อมูลแบบเบย์: วินาที 5.5, 2003 ซึ่งศึกษาผลของการฝึกสอนต่อประสิทธิภาพ SAT ในแปดโรงเรียน

ข้อมูลได้รับจาก:

 >> > import numpy as np

>> > J = 8
>> > y = np . array ([ 28.0 , 8.0 , - 3.0 , 7.0 , - 1.0 , 1.0 , 18.0 , 12.0 ])
>> > sigma = np . array ([ 15.0 , 10.0 , 16.0 , 11.0 , 9.0 , 11.0 , 10.0 , 18.0 ])

โดยที่ y คือผลการรักษาและ sigma เป็นข้อผิดพลาดมาตรฐาน เราสร้างแบบจำลองลำดับชั้นสำหรับการศึกษาที่เราสมมติว่าพารามิเตอร์ระดับกลุ่ม theta สำหรับแต่ละโรงเรียนจะได้รับการสุ่มตัวอย่างจากการแจกแจงแบบปกติโดยไม่ทราบค่าเฉลี่ย mu และค่าเบี่ยงเบนมาตรฐาน tau ในขณะที่ข้อมูลที่สังเกตได้ถูกสร้างขึ้นจากการแจกแจงปกติด้วยค่าเฉลี่ย และค่าเบี่ยงเบนมาตรฐานที่ได้รับจาก theta (ผลจริง) และ sigma มาตามลำดับ สิ่งนี้ช่วยให้เราสามารถประเมินพารามิเตอร์ระดับประชากร mu และ tau โดยรวมจากการสังเกตทั้งหมดในขณะที่ยังคงอนุญาตให้มีการเปลี่ยนแปลงส่วนบุคคลระหว่างโรงเรียนโดยใช้พารามิเตอร์ theta ระดับกลุ่ม

 >> > import numpyro
>> > import numpyro . distributions as dist

>> > # Eight Schools example
... def eight_schools ( J , sigma , y = None ):
...     mu = numpyro . sample ( 'mu' , dist . Normal ( 0 , 5 ))
...     tau = numpyro . sample ( 'tau' , dist . HalfCauchy ( 5 ))
...     with numpyro . plate ( 'J' , J ):
...         theta = numpyro . sample ( 'theta' , dist . Normal ( mu , tau ))
...         numpyro . sample ( 'obs' , dist . Normal ( theta , sigma ), obs = y )

ให้เราอนุมานค่าของพารามิเตอร์ที่ไม่รู้จักในโมเดลของเราโดยเรียกใช้ MCMC โดยใช้ตัวอย่าง No-U-Turn (Nuts) หมายเหตุการใช้อาร์กิวเมนต์ extra_fields ใน MCMC.Run โดยค่าเริ่มต้นเราจะรวบรวมตัวอย่างจากการกระจายเป้าหมาย (หลัง) เมื่อเราเรียกใช้การอนุมานโดยใช้ MCMC อย่างไรก็ตามการรวบรวมฟิลด์เพิ่มเติมเช่นพลังงานที่มีศักยภาพหรือความน่าจะเป็นในการยอมรับของตัวอย่างสามารถทำได้อย่างง่ายดายโดยใช้อาร์กิวเมนต์ extra_fields สำหรับรายการฟิลด์ที่เป็นไปได้ที่สามารถรวบรวมได้ให้ดูที่วัตถุ HMCSTATE ในตัวอย่างนี้เราจะรวบรวม potential_energy สำหรับแต่ละตัวอย่าง

 >> > from jax import random
>> > from numpyro . infer import MCMC , NUTS

>> > nuts_kernel = NUTS ( eight_schools )
>> > mcmc = MCMC ( nuts_kernel , num_warmup = 500 , num_samples = 1000 )
>> > rng_key = random . PRNGKey ( 0 )
>> > mcmc . run ( rng_key , J , sigma , y = y , extra_fields = ( 'potential_energy' ,))

เราสามารถพิมพ์บทสรุปของ MCMC Run และตรวจสอบว่าเราสังเกตเห็นความแตกต่างใด ๆ ในระหว่างการอนุมาน นอกจากนี้เนื่องจากเรารวบรวมพลังงานที่เป็นไปได้สำหรับแต่ละตัวอย่างเราจึงสามารถคำนวณความหนาแน่นร่วมของบันทึกที่คาดหวังได้อย่างง่ายดาย

 >> > mcmc . print_summary ()  # doctest: +SKIP

                mean       std    median      5.0 %     95.0 %     n_eff     r_hat
        mu      4.14      3.18      3.87     - 0.76      9.50    115.42      1.01
       tau      4.12      3.58      3.12      0.51      8.56     90.64      1.02
  theta [ 0 ]      6.40      6.22      5.36     - 2.54     15.27    176.75      1.00
  theta [ 1 ]      4.96      5.04      4.49     - 1.98     14.22    217.12      1.00
  theta [ 2 ]      3.65      5.41      3.31     - 3.47     13.77    247.64      1.00
  theta [ 3 ]      4.47      5.29      4.00     - 3.22     12.92    213.36      1.01
  theta [ 4 ]      3.22      4.61      3.28     - 3.72     10.93    242.14      1.01
  theta [ 5 ]      3.89      4.99      3.71     - 3.39     12.54    206.27      1.00
  theta [ 6 ]      6.55      5.72      5.66     - 1.43     15.78    124.57      1.00
  theta [ 7 ]      4.81      5.95      4.19     - 3.90     13.40    299.66      1.00

Number of divergences : 19

>> > pe = mcmc . get_extra_fields ()[ 'potential_energy' ]
>> > print ( 'Expected log joint density: {:.2f}' . format ( np . mean ( - pe )))  # doctest: +SKIP
Expected log joint density : - 54.55

ค่าที่สูงกว่า 1 สำหรับการวินิจฉัยแบบแยกเจลแมน Rubin ( r_hat ) บ่งชี้ว่าห่วงโซ่ยังไม่ได้มาบรรจบกันอย่างเต็มที่ ค่าต่ำสำหรับขนาดตัวอย่างที่มีประสิทธิภาพ ( n_eff ) โดยเฉพาะอย่างยิ่งสำหรับ tau และจำนวนการเปลี่ยนที่แตกต่างนั้นดูมีปัญหา โชคดีที่นี่เป็นพยาธิสภาพทั่วไปที่สามารถแก้ไขได้โดยใช้การกำหนดพารามิเตอร์ที่ไม่ได้เป็นศูนย์กลางสำหรับ tau ในแบบจำลองของเรา สิ่งนี้ตรงไปตรงมาที่จะทำใน Numpyro โดยใช้อินสแตนซ์ transformedDistribution พร้อมกับตัวจัดการเอฟเฟกต์ reparametization ให้เราเขียนโมเดลเดียวกันใหม่ แต่แทนที่จะสุ่มตัวอย่าง theta จาก Normal(mu, tau) เราจะสุ่มตัวอย่างจากการแจกแจงฐาน Normal(0, 1) ที่เปลี่ยนโดยใช้ AffineTransform โปรดทราบว่าโดยการทำเช่นนั้น NumPyro เรียกใช้ HMC โดยการสร้างตัวอย่าง theta_base สำหรับการแจกแจงฐาน Normal(0, 1) แทน เราเห็นว่าห่วงโซ่ผลลัพธ์ไม่ได้รับผลกระทบจากพยาธิสภาพเดียวกัน - การวินิจฉัย Gelman Rubin คือ 1 สำหรับพารามิเตอร์ทั้งหมดและขนาดตัวอย่างที่มีประสิทธิภาพดูค่อนข้างดี!

 >> > from numpyro . infer . reparam import TransformReparam

>> > # Eight Schools example - Non-centered Reparametrization
... def eight_schools_noncentered ( J , sigma , y = None ):
...     mu = numpyro . sample ( 'mu' , dist . Normal ( 0 , 5 ))
...     tau = numpyro . sample ( 'tau' , dist . HalfCauchy ( 5 ))
...     with numpyro . plate ( 'J' , J ):
...         with numpyro . handlers . reparam ( config = { 'theta' : TransformReparam ()}):
...             theta = numpyro . sample (
...                 'theta' ,
...                 dist . TransformedDistribution ( dist . Normal ( 0. , 1. ),
...                                              dist . transforms . AffineTransform ( mu , tau )))
...         numpyro . sample ( 'obs' , dist . Normal ( theta , sigma ), obs = y )

>> > nuts_kernel = NUTS ( eight_schools_noncentered )
>> > mcmc = MCMC ( nuts_kernel , num_warmup = 500 , num_samples = 1000 )
>> > rng_key = random . PRNGKey ( 0 )
>> > mcmc . run ( rng_key , J , sigma , y = y , extra_fields = ( 'potential_energy' ,))
>> > mcmc . print_summary ( exclude_deterministic = False )  # doctest: +SKIP

                   mean       std    median      5.0 %     95.0 %     n_eff     r_hat
           mu      4.08      3.51      4.14     - 1.69      9.71    720.43      1.00
          tau      3.96      3.31      3.09      0.01      8.34    488.63      1.00
     theta [ 0 ]      6.48      5.72      6.08     - 2.53     14.96    801.59      1.00
     theta [ 1 ]      4.95      5.10      4.91     - 3.70     12.82   1183.06      1.00
     theta [ 2 ]      3.65      5.58      3.72     - 5.71     12.13    581.31      1.00
     theta [ 3 ]      4.56      5.04      4.32     - 3.14     12.92   1282.60      1.00
     theta [ 4 ]      3.41      4.79      3.47     - 4.16     10.79    801.25      1.00
     theta [ 5 ]      3.58      4.80      3.78     - 3.95     11.55   1101.33      1.00
     theta [ 6 ]      6.31      5.17      5.75     - 2.93     13.87   1081.11      1.00
     theta [ 7 ]      4.81      5.38      4.61     - 3.29     14.05    954.14      1.00
theta_base [ 0 ]      0.41      0.95      0.40     - 1.09      1.95    851.45      1.00
theta_base [ 1 ]      0.15      0.95      0.20     - 1.42      1.66   1568.11      1.00
theta_base [ 2 ]     - 0.08      0.98     - 0.10     - 1.68      1.54   1037.16      1.00
theta_base [ 3 ]      0.06      0.89      0.05     - 1.42      1.47   1745.02      1.00
theta_base [ 4 ]     - 0.14      0.94     - 0.16     - 1.65      1.45    719.85      1.00
theta_base [ 5 ]     - 0.10      0.96     - 0.14     - 1.57      1.51   1128.45      1.00
theta_base [ 6 ]      0.38      0.95      0.42     - 1.32      1.82   1026.50      1.00
theta_base [ 7 ]      0.10      0.97      0.10     - 1.51      1.65   1190.98      1.00

Number of divergences : 0

>> > pe = mcmc . get_extra_fields ()[ 'potential_energy' ]
>> > # Compare with the earlier value
>> > print ( 'Expected log joint density: {:.2f}' . format ( np . mean ( - pe )))  # doctest: +SKIP
Expected log joint density : - 46.09

โปรดทราบว่าสำหรับชั้นเรียนของการแจกแจงด้วย loc,scale เช่น Normal Cauchy StudentT เรายังให้ reparameterizer locscalereparam reparameterizer เพื่อให้บรรลุวัตถุประสงค์เดียวกัน รหัสที่เกี่ยวข้องจะเป็น

 with numpyro.handlers.reparam(config={'theta': LocScaleReparam(centered=0)}):
    theta = numpyro.sample('theta', dist.Normal(mu, tau))

ตอนนี้ให้เราสมมติว่าเรามีโรงเรียนใหม่ที่เราไม่ได้สังเกตคะแนนการทดสอบใด ๆ แต่เราต้องการสร้างการคาดการณ์ Numpyro จัดให้มีคลาสการทำนายเพื่อจุดประสงค์ดังกล่าว โปรดทราบว่าในกรณีที่ไม่มีข้อมูลใด ๆ ที่สังเกตได้เราเพียงใช้พารามิเตอร์ระดับประชากรเพื่อสร้างการคาดการณ์ เงื่อนไขยูทิลิตี้ Predictive ไซต์ mu และ tau ที่ไม่ได้รับการตรวจสอบไปจนถึงค่าที่ดึงมาจากการกระจายหลังจาก MCMC ครั้งล่าสุดของเราและเรียกใช้แบบจำลองไปข้างหน้าเพื่อสร้างการทำนาย

 >> > from numpyro . infer import Predictive

>> > # New School
... def new_school ():
...     mu = numpyro . sample ( 'mu' , dist . Normal ( 0 , 5 ))
...     tau = numpyro . sample ( 'tau' , dist . HalfCauchy ( 5 ))
...     return numpyro . sample ( 'obs' , dist . Normal ( mu , tau ))

>> > predictive = Predictive ( new_school , mcmc . get_samples ())
>> > samples_predictive = predictive ( random . PRNGKey ( 1 ))
>> > print ( np . mean ( samples_predictive [ 'obs' ]))  # doctest: +SKIP
3.9886456

ตัวอย่างเพิ่มเติม

สำหรับตัวอย่างเพิ่มเติมเกี่ยวกับการระบุโมเดลและการอนุมานใน NUMPYRO:

การถดถอยแบบเบย์ใน NUMPYRO - เริ่มต้นที่นี่เพื่อทำความคุ้นเคยกับการเขียนแบบจำลองอย่างง่ายใน NUMPYRO, API การอนุมาน MCMC, ตัวจัดการเอฟเฟกต์และการเขียนยูทิลิตี้การอนุมานที่กำหนดเอง
การพยากรณ์อนุกรมเวลา - แสดงวิธีการแปลงสำหรับลูปในโมเดลเป็น lax.scan Primitive สำหรับการอนุมานอย่างรวดเร็ว
ตัวอย่างคำอธิบายประกอบ - แสดงวิธีการใช้กลไกการแจงนับเพื่อทำการอนุมานสำหรับแบบจำลองที่มีตัวแปรแฝงแบบไม่ต่อเนื่อง
ตัวอย่างเบสบอล - การใช้น็อตสำหรับแบบจำลองลำดับชั้นอย่างง่าย เปรียบเทียบสิ่งนี้กับตัวอย่างเบสบอลใน Pyro
โมเดล Markov ที่ซ่อนอยู่ใน Numpyro เมื่อเทียบกับ Stan
Variational Autoencoder - เป็นตัวอย่างง่ายๆที่ใช้การอนุมานแบบแปรผันกับเครือข่ายประสาท การใช้งาน Pyro สำหรับการเปรียบเทียบ
กระบวนการเกาส์เซียน - เป็นตัวอย่างง่ายๆในการใช้น็อตเพื่อสุ่มตัวอย่างจากด้านหลังเหนือพารามิเตอร์ไฮเปอร์ของกระบวนการเกาส์เซียน
การถดถอย Horseshoe-แสดงวิธีการใช้แบบจำลองเชิงเส้นทั่วไปที่ติดตั้งเกือกม้าก่อนหน้าสำหรับทั้งคู่ที่มีค่าไบนารีและค่าจริง
การคิดใหม่ทางสถิติกับ Numpyro - สมุดบันทึกที่มีการแปลรหัสในหนังสือทบทวนทางสถิติของ Richard McElreath รุ่นที่สองไปยัง Numpyro
ตัวอย่างรุ่นอื่น ๆ สามารถพบได้ในเว็บไซต์ตัวอย่าง

ผู้ใช้ Pyro จะทราบว่า API สำหรับข้อกำหนดของแบบจำลองและการอนุมานส่วนใหญ่เหมือนกับ Pyro รวมถึงการแจกแจง API โดยการออกแบบ อย่างไรก็ตามมีความแตกต่างหลักที่สำคัญบางประการ (สะท้อนให้เห็นในภายใน) ที่ผู้ใช้ควรตระหนักถึง เช่นใน numpyro ไม่มีการจัดเก็บพารามิเตอร์ทั่วโลกหรือสถานะสุ่มเพื่อให้เราสามารถใช้ประโยชน์จากการรวบรวม JIT ของ Jax นอกจากนี้ผู้ใช้อาจต้องเขียนโมเดลของพวกเขาในรูปแบบ การทำงาน ที่ดีขึ้นซึ่งทำงานได้ดีขึ้นกับ JAX อ้างถึงคำถามที่พบบ่อยสำหรับรายการความแตกต่าง

ภาพรวมของอัลกอริทึมการอนุมาน

เราให้ภาพรวมของอัลกอริทึมการอนุมานส่วนใหญ่ที่สนับสนุนโดย NUMPYRO และเสนอแนวทางบางอย่างเกี่ยวกับอัลกอริทึมการอนุมานที่อาจเหมาะสมสำหรับคลาสที่แตกต่างกันของแบบจำลอง

MCMC

ถั่วซึ่งเป็นตัวแปรที่ปรับตัวได้ของ HMC อาจเป็นอัลกอริทึมการอนุมานที่ใช้กันมากที่สุดใน Numpyro โปรดทราบว่าน็อตและ HMC ไม่สามารถใช้งานได้โดยตรงกับรุ่นที่มีตัวแปรแฝงแบบไม่ต่อเนื่อง แต่ในกรณีที่ตัวแปรที่ไม่ต่อเนื่องมีการสนับสนุนที่ จำกัด และสรุปได้ ในตัวแปรแฝงอย่างต่อเนื่องที่เหลืออยู่ ตามที่กล่าวไว้ข้างต้นการปรับเปลี่ยนรูปแบบอาจมีความสำคัญในบางกรณีเพื่อให้ได้ประสิทธิภาพที่ดี โปรดทราบว่าโดยทั่วไปแล้วเราคาดว่าการอนุมานจะยากขึ้นเมื่อมิติของพื้นที่แฝงเพิ่มขึ้น ดูการสอนรูปทรงเรขาคณิตที่ไม่ดีสำหรับเคล็ดลับและลูกเล่นเพิ่มเติม
MixHHMC สามารถเป็นกลยุทธ์การอนุมานที่มีประสิทธิภาพสำหรับแบบจำลองที่มีตัวแปรแฝงอย่างต่อเนื่องและไม่ต่อเนื่อง
HMCECs สามารถเป็นกลยุทธ์การอนุมานที่มีประสิทธิภาพสำหรับแบบจำลองที่มีจุดข้อมูลจำนวนมาก มันใช้ได้กับรุ่นที่มีตัวแปรแฝงอย่างต่อเนื่อง ดูตัวอย่างที่นี่
Barkermh เป็นวิธีการ MCMC แบบไล่ระดับสีที่อาจแข่งขันกับ HMC และ Nuts สำหรับบางรุ่น มันใช้ได้กับรุ่นที่มีตัวแปรแฝงอย่างต่อเนื่อง
HMCGIBBS รวมขั้นตอน HMC/Nuts เข้ากับการอัปเดต Gibbs ที่กำหนดเอง ผู้ใช้จะต้องระบุการอัปเดตของ Gibbs
DeveTeHMCGIBBS รวมขั้นตอน HMC/NUTS เข้ากับการอัปเดต GIBBS สำหรับตัวแปรแฝงแบบไม่ต่อเนื่อง การอัปเดต Gibbs ที่เกี่ยวข้องจะถูกคำนวณโดยอัตโนมัติ
SA เป็นวิธีการ MCMC เพียงวิธีเดียวใน NUMPYRO ที่ไม่ได้ใช้ประโยชน์จากการไล่ระดับสี มันใช้ได้เฉพาะกับรุ่นที่มีตัวแปรแฝงอย่างต่อเนื่อง คาดว่าจะทำงานได้ดีที่สุดสำหรับรุ่นที่มีมิติแฝงอยู่ในระดับต่ำถึงปานกลาง มันอาจเป็นตัวเลือกที่ดีสำหรับรุ่นที่มีความหนาแน่นของบันทึกที่ไม่แตกต่างกัน โปรดทราบว่าโดยทั่วไปแล้ว SA ต้องการตัวอย่างจำนวน มาก เนื่องจากการผสมมีแนวโน้มที่จะช้า ในทุกขั้นตอนของแต่ละขั้นตอนสามารถรวดเร็ว

เช่นเดียวกับ HMC/Nuts อัลกอริทึม MCMC ที่เหลือทั้งหมดสนับสนุนการแจงนับมากกว่าตัวแปรแฝงแบบไม่ต่อเนื่องหากเป็นไปได้ (ดูข้อ จำกัด ) ไซต์ที่แจกแจงจะต้องทำเครื่องหมายด้วย infer={'enumerate': 'parallel'} เช่นในตัวอย่างคำอธิบายประกอบ

การสุ่มตัวอย่าง

NestedSampler เสนอเสื้อคลุมสำหรับ Jaxns ดูตัวอย่างของ Jaxns สำหรับตัวอย่างและการสุ่มตัวอย่างที่ซ้อนกันสำหรับตัวอย่างเชลล์เกาส์เซียนสำหรับวิธีการใช้ตัวอย่างในรุ่น NUMPYRO สามารถจัดการกับแบบจำลองโดยพลการรวมถึงรุ่นที่มี RVs แบบไม่ต่อเนื่องและการแปลงที่ไม่สามารถเข้าถึงได้

การอนุมานการแปรปรวนแบบสุ่ม

วัตถุประสงค์แปรปรวน
- Trace_elbo เป็นการใช้งาน ELBO ขั้นพื้นฐานของเรา
- Tracemeanfield_elbo เป็นเหมือน Trace_ELBO แต่คำนวณส่วนหนึ่งของ ELBO ในการวิเคราะห์หากเป็นไปได้
- Tracegraph_elbo เสนอกลยุทธ์การลดความแปรปรวนสำหรับแบบจำลองที่มีตัวแปรแฝงแบบไม่ต่อเนื่อง โดยทั่วไปแล้ว ELBO นี้ควรใช้สำหรับแบบจำลองที่มีตัวแปรแฝงแบบไม่ต่อเนื่องเสมอ
- Traceenum_elbo เสนอกลยุทธ์การแจงนับตัวแปรสำหรับโมเดลที่มีตัวแปรแฝงแบบไม่ต่อเนื่อง โดยทั่วไปแล้ว ELBO นี้ควรใช้สำหรับแบบจำลองที่มีตัวแปรแฝงแบบไม่ต่อเนื่องเมื่อเป็นไปได้
คู่มืออัตโนมัติ (เหมาะสมสำหรับรุ่นที่มีตัวแปรแฝงอย่างต่อเนื่อง)
- autonormal และ autodiagonalnormal เป็นคู่มือค่าเฉลี่ยพื้นฐานของเรา หากพื้นที่แฝงไม่ใช่ Euclidean (เนื่องจากเช่นข้อ จำกัด เชิงบวกบนหนึ่งในไซต์ตัวอย่าง) การแปลง bijective ที่เหมาะสมจะถูกนำมาใช้โดยอัตโนมัติภายใต้ฝากระโปรงเพื่อแมประหว่างพื้นที่ที่ไม่มีข้อ จำกัด พื้นที่ จำกัด (โปรดทราบว่านี่เป็นจริงสำหรับคู่มืออัตโนมัติทั้งหมด) คู่มือเหล่านี้เป็นจุดเริ่มต้นที่ยอดเยี่ยมเมื่อพยายามที่จะได้รับการอนุมานแบบแปรผันเพื่อทำงานกับโมเดลที่คุณกำลังพัฒนา
- automultivariatenormal และ autolowrankmultivariatenormal ยังสร้างการกระจายตัวแบบปกติ แต่ให้ความยืดหยุ่นมากขึ้นเนื่องจากพวกเขาสามารถจับความสัมพันธ์ในด้านหลัง โปรดทราบว่าคู่มือเหล่านี้อาจเป็นเรื่องยากที่จะพอดีกับการตั้งค่ามิติสูง
- Autodelta ใช้สำหรับการประมาณค่าจุดประมวลผลผ่าน MAP (การประมาณค่าสูงสุดหลัง) ดูที่นี่ตัวอย่างการใช้งาน
- AutobnaFnormal และ autoiafnormal เสนอการแจกแจงแบบแปรผันที่ยืดหยุ่นพารามิเตอร์โดยการทำให้กระแสเป็นมาตรฐาน
- Autodais เป็นอัลกอริทึมการอนุมานที่มีประสิทธิภาพซึ่งใช้ประโยชน์จาก HMC มันอาจเป็นทางเลือกที่ดีสำหรับการจัดการกับ posteriors ที่มีความสัมพันธ์สูง แต่อาจมีราคาแพงขึ้นอยู่กับลักษณะของแบบจำลอง
- AutoSurrogatelikelihoodDais เป็นอัลกอริทึมการอนุมานแบบแปรผันที่ทรงพลังที่ใช้ประโยชน์จาก HMC และรองรับการสุ่มตัวอย่างข้อมูล
- Autosemidais สร้างการประมาณหลังเช่น autodais สำหรับตัวแปรแฝงในท้องถิ่น แต่ให้การสนับสนุนการสุ่มข้อมูลในระหว่างการฝึกอบรม ELBO โดยใช้คู่มือพารามิเตอร์สำหรับตัวแปรแฝงทั่วโลก
- Autolaplaceapproximation สามารถใช้ในการคำนวณการประมาณ Laplace

การอนุมานการแปรปรวนของสไตน์

ดูเอกสารสำหรับรายละเอียดเพิ่มเติม

การติดตั้ง

การสนับสนุน Windows ที่ จำกัด : โปรดทราบว่า Numpyro ยังไม่ได้ทดสอบบน Windows และอาจต้องสร้าง Jaxlib จากแหล่งที่มา ดูปัญหา JAX นี้สำหรับรายละเอียดเพิ่มเติม หรือคุณสามารถติดตั้งระบบย่อย Windows สำหรับ Linux และใช้ numpyro บนระบบในระบบ Linux ดูเพิ่มเติม CUDA บนระบบย่อย Windows สำหรับ Linux และโพสต์ฟอรัมนี้หากคุณต้องการใช้ GPU บน Windows

ในการติดตั้ง numpyro ด้วย JAX เวอร์ชันล่าสุดของ CPU คุณสามารถใช้ PIP:

 pip install numpyro

ในกรณีของปัญหาความเข้ากันได้เกิดขึ้นระหว่างการดำเนินการคำสั่งข้างต้นคุณสามารถบังคับให้ติดตั้ง JAX เวอร์ชันที่เข้ากันได้

 pip install numpyro[cpu]

ในการใช้ NUMPYRO บน GPU คุณต้องติดตั้ง CUDA ก่อนจากนั้นใช้คำสั่ง PIP ต่อไปนี้:

 pip install numpyro[cuda] -f https://storage.googleapis.com/jax-releases/jax_cuda_releases.html

หากคุณต้องการคำแนะนำเพิ่มเติมโปรดดูคำแนะนำการติดตั้ง JAX GPU

ในการเรียกใช้ numpyro บนคลาวด์ TPUs คุณสามารถดูตัวอย่าง JAX บนตัวอย่าง Cloud TPU

สำหรับ Cloud TPU VM คุณต้องตั้งค่าแบ็กเอนด์ TPU ตามรายละเอียดในคู่มือ Cloud TPU VM JAX Quickstart หลังจากที่คุณได้ตรวจสอบแล้วว่าแบ็กเอนด์ TPU ได้รับการตั้งค่าอย่างถูกต้องคุณสามารถติดตั้ง numpyro โดยใช้คำสั่ง pip install numpyro

แพลตฟอร์มเริ่มต้น: JAX จะใช้ GPU โดยค่าเริ่มต้นหากติดตั้งแพ็คเกจ jaxlib ที่รองรับ Cuda คุณสามารถใช้ SET_PLATFORM UTILITY numpyro.set_platform("cpu") เพื่อเปลี่ยนเป็น CPU ที่จุดเริ่มต้นของโปรแกรมของคุณ

นอกจากนี้คุณยังสามารถติดตั้ง numpyro จากแหล่งที่มา:

 git clone https://github.com/pyro-ppl/numpyro.git
cd numpyro
# install jax/jaxlib first for CUDA support
pip install -e .[dev]  # contains additional dependencies for NumPyro development

คุณยังสามารถติดตั้ง numpyro ด้วย conda:

 conda install -c conda-forge numpyro

คำถามที่พบบ่อย

ซึ่งแตกต่างจากใน pyro, numpyro.sample('x', dist.Normal(0, 1)) ไม่ทำงาน ทำไม
คุณมักจะใช้คำสั่ง numpyro.sample นอกบริบทการอนุมาน JAX ไม่มีสถานะสุ่มทั่วโลกและเช่นนี้ตัวอย่างการแจกจ่ายจำเป็นต้องใช้คีย์ตัวสร้างตัวเลขสุ่มที่ชัดเจน (PRNGKEY) เพื่อสร้างตัวอย่างจาก อัลกอริธึมการอนุมานของ Numpyro ใช้ตัวจัดการเมล็ดเพื่อเธรดในคีย์เครื่องกำเนิดตัวเลขแบบสุ่มเบื้องหลัง
ตัวเลือกของคุณคือ:
- เรียกการกระจายโดยตรงและให้ PRNGKey เช่น dist.Normal(0, 1).sample(PRNGKey(0))
- ระบุอาร์กิวเมนต์ rng_key ให้กับ numpyro.sample เช่น numpyro.sample('x', dist.Normal(0, 1), rng_key=PRNGKey(0))
- ห่อรหัสในตัวจัดการ seed ใช้เป็นตัวจัดการบริบทหรือเป็นฟังก์ชั่นที่พันผ่าน callable ดั้งเดิม เช่น
```
 with handlers . seed ( rng_seed = 0 ):  # random.PRNGKey(0) is used
    x = numpyro . sample ( 'x' , dist . Beta ( 1 , 1 ))    # uses a PRNGKey split from random.PRNGKey(0)
    y = numpyro . sample ( 'y' , dist . Bernoulli ( x ))  # uses different PRNGKey split from the last one
```
  หรือเป็นฟังก์ชั่นการสั่งซื้อที่สูงขึ้น:
```
 def fn ():
    x = numpyro . sample ( 'x' , dist . Beta ( 1 , 1 ))
    y = numpyro . sample ( 'y' , dist . Bernoulli ( x ))
    return y

print ( handlers . seed ( fn , rng_seed = 0 )())
```
ฉันสามารถใช้โมเดล Pyro เดียวกันเพื่อทำการอนุมานใน Numpyro ได้หรือไม่?
ดังที่คุณอาจสังเกตเห็นจากตัวอย่าง NumPyro รองรับ Pyro Primitives ทั้งหมดเช่น sample , param , plate และ module และ Effect Handlers นอกจากนี้เรายังมั่นใจได้ว่าการแจกแจง API นั้นขึ้นอยู่กับ torch.distributions และคลาสการอนุมานเช่น SVI และ MCMC มีอินเทอร์เฟซเดียวกัน สิ่งนี้พร้อมกับความคล้ายคลึงกันใน API สำหรับการดำเนินการ NUMPY และ Pytorch ทำให้มั่นใจได้ว่าแบบจำลองที่มีข้อความ Pyro Primitive สามารถใช้กับแบ็กเอนด์ที่มีการเปลี่ยนแปลงเล็กน้อย ตัวอย่างความแตกต่างบางอย่างพร้อมกับการเปลี่ยนแปลงที่จำเป็นจะมีการบันทึกไว้ด้านล่าง:
- การดำเนินการ torch ใด ๆ ในโมเดลของคุณจะต้องเขียนในแง่ของการดำเนินการ jax.numpy ที่เกี่ยวข้อง นอกจากนี้การดำเนินการ torch ทั้งหมดไม่ได้มี numpy คู่ (และในทางกลับกัน) และบางครั้งก็มีความแตกต่างเล็กน้อยใน API
- ข้อความ pyro.sample นอกบริบทการอนุมานจะต้องถูกห่อหุ้มด้วยตัวจัดการ seed ตามที่กล่าวไว้ข้างต้น
- ไม่มีการจัดเก็บพารามิเตอร์ทั่วโลกและการใช้ numpyro.param นอกบริบทการอนุมานจะไม่มีผล ในการดึงค่าพารามิเตอร์ที่ดีที่สุดจาก SVI ให้ใช้วิธี SVI.Get_Params โปรดทราบว่าคุณยังสามารถใช้คำสั่ง param ภายในโมเดลและ NUMPYRO จะใช้ตัวจัดการเอฟเฟกต์ทดแทนภายในเพื่อทดแทนค่าจากเครื่องมือเพิ่มประสิทธิภาพเมื่อเรียกใช้โมเดลใน SVI
- โมดูลเครือข่าย Neural Pytorch จะต้องเขียนใหม่เป็นเครือข่าย Neural Flax หรือ Haiku ดูตัวอย่าง VAE และ PRODLDA สำหรับความแตกต่างในไวยากรณ์ระหว่างสองแบ็กเอนด์
- JAX ทำงานได้ดีที่สุดด้วยรหัสการทำงานโดยเฉพาะอย่างยิ่งถ้าเราต้องการใช้ประโยชน์จากการรวบรวม JIT ซึ่ง NumPyro ทำภายในสำหรับรูทีนย่อยการอนุมานจำนวนมาก ดังนั้นหากโมเดลของคุณมีผลข้างเคียงที่ไม่สามารถมองเห็นได้จาก Jax Tracer ก็อาจจำเป็นต้องเขียนใหม่ในรูปแบบการทำงานมากขึ้น
สำหรับรุ่นเล็กส่วนใหญ่การเปลี่ยนแปลงที่จำเป็นในการเรียกใช้การอนุมานใน Numpyro ควรเป็นเล็กน้อย นอกจากนี้เรากำลังทำงานกับ Pyro-API ซึ่งช่วยให้คุณสามารถเขียนรหัสเดียวกันและส่งไปยังแบ็กเอนด์หลายรายการรวมถึง NUMPyro สิ่งนี้จะต้องมีข้อ จำกัด มากขึ้น แต่มีข้อได้เปรียบในการเป็นผู้ไม่เชื่อเรื่องพระเจ้า ดูเอกสารสำหรับตัวอย่างและแจ้งให้เราทราบความคิดเห็นของคุณ
ฉันจะมีส่วนร่วมในโครงการได้อย่างไร?
ขอบคุณสำหรับความสนใจในโครงการ! คุณสามารถดูปัญหาที่เป็นมิตรกับผู้เริ่มต้นที่ทำเครื่องหมายด้วยแท็กปัญหาแรกที่ดีใน GitHub นอกจากนี้โปรดรู้สึกถึงเราในฟอรัม

งานในอนาคต / ต่อเนื่อง

ในระยะเวลาอันใกล้นี้เราวางแผนที่จะทำงานต่อไปนี้ กรุณาเปิดปัญหาใหม่สำหรับคำขอและการปรับปรุงคุณสมบัติ:

การปรับปรุงความทนทานของการอนุมานในรุ่นต่าง ๆ การทำโปรไฟล์และการปรับแต่งประสิทธิภาพ
สนับสนุนฟังก์ชั่นมากขึ้นซึ่งเป็นส่วนหนึ่งของอินเทอร์เฟซการสร้างแบบจำลองทั่วไปของ Pyro-API
อัลกอริทึมการอนุมานมากขึ้นโดยเฉพาะอย่างยิ่งที่ต้องการอนุพันธ์ลำดับที่สองหรือใช้ HMC
การรวมเข้ากับ Funsor เพื่อสนับสนุนอัลกอริทึมการอนุมานกับการสุ่มตัวอย่างล่าช้า
พื้นที่อื่น ๆ ได้รับแรงบันดาลใจจากเป้าหมายการวิจัยของ Pyro และการมุ่งเน้นการใช้งานและความสนใจจากชุมชน

อ้างถึง numpyro

แนวคิดที่สร้างแรงบันดาลใจที่อยู่เบื้องหลัง Numpyro และคำอธิบายของถั่วซ้ำสามารถพบได้ในบทความนี้ที่ปรากฏใน Neurips 2019 การแปลงโปรแกรมสำหรับการประชุมเชิงปฏิบัติการการเรียนรู้ของเครื่อง

หากคุณใช้ numpyro โปรดพิจารณาอ้าง:

 @article{phan2019composable,
  title={Composable Effects for Flexible and Accelerated Probabilistic Programming in NumPyro},
  author={Phan, Du and Pradhan, Neeraj and Jankowiak, Martin},
  journal={arXiv preprint arXiv:1912.11554},
  year={2019}
}

เช่นเดียวกับ

 @article{bingham2019pyro,
  author    = {Eli Bingham and
               Jonathan P. Chen and
               Martin Jankowiak and
               Fritz Obermeyer and
               Neeraj Pradhan and
               Theofanis Karaletsos and
               Rohit Singh and
               Paul A. Szerlip and
               Paul Horsfall and
               Noah D. Goodman},
  title     = {Pyro: Deep Universal Probabilistic Programming},
  journal   = {J. Mach. Learn. Res.},
  volume    = {20},
  pages     = {28:1--28:6},
  year      = {2019},
  url       = {http://jmlr.org/papers/v20/18-403.html}
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 0.15.3
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-01
ขนาด 19.18MB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
SmartTube

ซอร์สโค้ดอื่น ๆ

24.71 Stable
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด