Descargar numpyro - Descargar el código fuente numpyro

numpyro

Otro código fuente

0.15.3

Descargar

Numpyro

Programación probabilística alimentada por JAX para Autograd y JIT Compilación a GPU/TPU/CPU.

Documentos y ejemplos | Foro

¿Qué es Numpyro?

Numpyro es una biblioteca de programación probabilística ligera que proporciona un backend numpy para Pyro. Confiamos en Jax para la diferenciación automática y la compilación JIT a GPU / CPU. Numpyro está en desarrollo activo, así que tenga cuidado con la fragilidad, los errores y los cambios en la API a medida que evoluciona el diseño.

Numpyro está diseñado para ser liviano y se centra en proporcionar un sustrato flexible en el que los usuarios puedan construir:

Pyro Primitives: los programas Numpyro pueden contener un código regular de Python y Numpy, además de primitivas Pyro como sample y param . El código del modelo debe verse muy similar a Pyro, excepto por algunas diferencias menores entre Pytorch y la API de Numpy. Vea el ejemplo a continuación.
Algoritmos de inferencia: Numpyro admite una serie de algoritmos de inferencia, con un enfoque particular en los algoritmos de MCMC como Hamiltonian Monte Carlo, incluida una implementación de la muestra sin giro en U. Los algoritmos MCMC adicionales incluyen mixedhmc (que puede acomodar variables latentes discretas), así como HMCEC (que solo calculan la probabilidad de subconjuntos de los datos en cada iteración). Una de las motivaciones para Numpyro era acelerar el Monte Carlo hamiltoniano al compilar el integrador Verlet que incluye múltiples cálculos de gradiente. Con Jax, podemos componer jit y grad para compilar todo el paso de integración en un núcleo optimizado XLA. También eliminamos la sobrecarga de Python al compilar toda la etapa de construcción de árboles en las nueces (esto es posible usando nueces iterativas). También hay una implementación de inferencia de variacional básica junto con muchas guías flexibles (auto) para la inferencia de variacional de diferenciación automática (AVENI). La implementación de inferencia variacional admite una serie de características, incluido el soporte para modelos con variables latentes discretas (ver TraceGraph_elbo y TraceEnum_elbo).
Distribuciones: el módulo Numpyro.Distributions proporciona clases de distribución, restricciones y transformaciones bijectivas. Las clases de distribución se envuelven sobre las muestras implementadas para trabajar con el generador de números pseudo-aleatorios funcionales de Jax. El diseño del módulo de distribuciones se deriva en gran medida de Pytorch. Se implementa un subconjunto importante de la API, y contiene la mayoría de las distribuciones comunes que existen en Pytorch. Como resultado, los usuarios de Pyro y Pytorch pueden confiar en la misma API y semántica de lotes que en torch.distributions . Además de las distribuciones, constraints y transforms son muy útiles cuando se operan en clases de distribución con soporte limitado. Finalmente, las distribuciones de la probabilidad de flujo de tensor (TFP) se pueden usar directamente en modelos Numpyro.
Los manejadores de efectos: al igual que Pyro, las primitivas como sample y param se pueden proporcionar interpretaciones no estándar utilizando manejadores de efectos del módulo numpyro.handlers, y estas se pueden extender fácilmente para implementar algoritmos de inferencia y utilidades de inferencia de inferencia personalizadas.

Un ejemplo simple: 8 escuelas

Exploremos Numpyro usando un ejemplo simple. Usaremos el ejemplo de las ocho escuelas de Gelman et al., Análisis de datos bayesianos: Sec. 5.5, 2003, que estudia el efecto del entrenamiento en el rendimiento del SAT en ocho escuelas.

Los datos están dados por:

 >> > import numpy as np

>> > J = 8
>> > y = np . array ([ 28.0 , 8.0 , - 3.0 , 7.0 , - 1.0 , 1.0 , 18.0 , 12.0 ])
>> > sigma = np . array ([ 15.0 , 10.0 , 16.0 , 11.0 , 9.0 , 11.0 , 10.0 , 18.0 ])

, donde y son los efectos del tratamiento y sigma el error estándar. Construimos tau modelo jerárquico para el estudio donde suponemos que los theta a nivel de grupo se muestrean a partir de una distribución normal con mu media desconocida y desviación estándar, mientras que los datos observados se generan a partir de una distribución normal con media y desviación estándar dada por theta (efecto verdadero) y sigma , respectivamente. Esto nos permite estimar los parámetros a nivel de población mu y tau al agrupar todas las observaciones, al tiempo que permiten la variación individual entre las escuelas que utilizan los parámetros theta a nivel de grupo.

 >> > import numpyro
>> > import numpyro . distributions as dist

>> > # Eight Schools example
... def eight_schools ( J , sigma , y = None ):
...     mu = numpyro . sample ( 'mu' , dist . Normal ( 0 , 5 ))
...     tau = numpyro . sample ( 'tau' , dist . HalfCauchy ( 5 ))
...     with numpyro . plate ( 'J' , J ):
...         theta = numpyro . sample ( 'theta' , dist . Normal ( mu , tau ))
...         numpyro . sample ( 'obs' , dist . Normal ( theta , sigma ), obs = y )

Inferimos los valores de los parámetros desconocidos en nuestro modelo ejecutando MCMC utilizando la muestra de no-u-girath (nueces). Tenga en cuenta el uso del argumento extra_fields en McMc.run. Por defecto, solo recolectamos muestras de la distribución de destino (posterior) cuando ejecutamos inferencia usando MCMC . Sin embargo, la recolección de campos adicionales como la energía potencial o la probabilidad de aceptación de una muestra se puede lograr fácilmente utilizando el argumento extra_fields . Para obtener una lista de posibles campos que se pueden recopilar, consulte el objeto HMCState. En este ejemplo, además recolectaremos el potential_energy para cada muestra.

 >> > from jax import random
>> > from numpyro . infer import MCMC , NUTS

>> > nuts_kernel = NUTS ( eight_schools )
>> > mcmc = MCMC ( nuts_kernel , num_warmup = 500 , num_samples = 1000 )
>> > rng_key = random . PRNGKey ( 0 )
>> > mcmc . run ( rng_key , J , sigma , y = y , extra_fields = ( 'potential_energy' ,))

Podemos imprimir el resumen de la ejecución de MCMC y examinar si observamos alguna divergencia durante la inferencia. Además, dado que recolectamos la energía potencial para cada una de las muestras, podemos calcular fácilmente la densidad de la junta de registro esperada.

 >> > mcmc . print_summary ()  # doctest: +SKIP

                mean       std    median      5.0 %     95.0 %     n_eff     r_hat
        mu      4.14      3.18      3.87     - 0.76      9.50    115.42      1.01
       tau      4.12      3.58      3.12      0.51      8.56     90.64      1.02
  theta [ 0 ]      6.40      6.22      5.36     - 2.54     15.27    176.75      1.00
  theta [ 1 ]      4.96      5.04      4.49     - 1.98     14.22    217.12      1.00
  theta [ 2 ]      3.65      5.41      3.31     - 3.47     13.77    247.64      1.00
  theta [ 3 ]      4.47      5.29      4.00     - 3.22     12.92    213.36      1.01
  theta [ 4 ]      3.22      4.61      3.28     - 3.72     10.93    242.14      1.01
  theta [ 5 ]      3.89      4.99      3.71     - 3.39     12.54    206.27      1.00
  theta [ 6 ]      6.55      5.72      5.66     - 1.43     15.78    124.57      1.00
  theta [ 7 ]      4.81      5.95      4.19     - 3.90     13.40    299.66      1.00

Number of divergences : 19

>> > pe = mcmc . get_extra_fields ()[ 'potential_energy' ]
>> > print ( 'Expected log joint density: {:.2f}' . format ( np . mean ( - pe )))  # doctest: +SKIP
Expected log joint density : - 54.55

Los valores anteriores 1 para el diagnóstico dividido de Gelman Rubin ( r_hat ) indican que la cadena no ha convergido completamente. El bajo valor para el tamaño de muestra efectivo ( n_eff ), particularmente para tau , y el número de transiciones divergentes parece problemático. Afortunadamente, esta es una patología común que puede rectificarse mediante el uso de una parametrización no centrada para tau en nuestro modelo. Esto es sencillo en Numpyro mediante el uso de una instancia de distribución transformada junto con un controlador de efecto de reparameterización. Reescribamos el mismo modelo, pero en lugar de muestrear theta de un Normal(mu, tau) , en su lugar lo probaremos de una distribución base Normal(0, 1) que se transforma utilizando una affinetransform. Tenga en cuenta que al hacerlo, Numpyro ejecuta HMC generando muestras theta_base para la distribución base Normal(0, 1) en su lugar. Vemos que la cadena resultante no sufre de la misma patología: el diagnóstico de Gelman Rubin es 1 para todos los parámetros y el tamaño de muestra efectivo se ve bastante bien.

 >> > from numpyro . infer . reparam import TransformReparam

>> > # Eight Schools example - Non-centered Reparametrization
... def eight_schools_noncentered ( J , sigma , y = None ):
...     mu = numpyro . sample ( 'mu' , dist . Normal ( 0 , 5 ))
...     tau = numpyro . sample ( 'tau' , dist . HalfCauchy ( 5 ))
...     with numpyro . plate ( 'J' , J ):
...         with numpyro . handlers . reparam ( config = { 'theta' : TransformReparam ()}):
...             theta = numpyro . sample (
...                 'theta' ,
...                 dist . TransformedDistribution ( dist . Normal ( 0. , 1. ),
...                                              dist . transforms . AffineTransform ( mu , tau )))
...         numpyro . sample ( 'obs' , dist . Normal ( theta , sigma ), obs = y )

>> > nuts_kernel = NUTS ( eight_schools_noncentered )
>> > mcmc = MCMC ( nuts_kernel , num_warmup = 500 , num_samples = 1000 )
>> > rng_key = random . PRNGKey ( 0 )
>> > mcmc . run ( rng_key , J , sigma , y = y , extra_fields = ( 'potential_energy' ,))
>> > mcmc . print_summary ( exclude_deterministic = False )  # doctest: +SKIP

                   mean       std    median      5.0 %     95.0 %     n_eff     r_hat
           mu      4.08      3.51      4.14     - 1.69      9.71    720.43      1.00
          tau      3.96      3.31      3.09      0.01      8.34    488.63      1.00
     theta [ 0 ]      6.48      5.72      6.08     - 2.53     14.96    801.59      1.00
     theta [ 1 ]      4.95      5.10      4.91     - 3.70     12.82   1183.06      1.00
     theta [ 2 ]      3.65      5.58      3.72     - 5.71     12.13    581.31      1.00
     theta [ 3 ]      4.56      5.04      4.32     - 3.14     12.92   1282.60      1.00
     theta [ 4 ]      3.41      4.79      3.47     - 4.16     10.79    801.25      1.00
     theta [ 5 ]      3.58      4.80      3.78     - 3.95     11.55   1101.33      1.00
     theta [ 6 ]      6.31      5.17      5.75     - 2.93     13.87   1081.11      1.00
     theta [ 7 ]      4.81      5.38      4.61     - 3.29     14.05    954.14      1.00
theta_base [ 0 ]      0.41      0.95      0.40     - 1.09      1.95    851.45      1.00
theta_base [ 1 ]      0.15      0.95      0.20     - 1.42      1.66   1568.11      1.00
theta_base [ 2 ]     - 0.08      0.98     - 0.10     - 1.68      1.54   1037.16      1.00
theta_base [ 3 ]      0.06      0.89      0.05     - 1.42      1.47   1745.02      1.00
theta_base [ 4 ]     - 0.14      0.94     - 0.16     - 1.65      1.45    719.85      1.00
theta_base [ 5 ]     - 0.10      0.96     - 0.14     - 1.57      1.51   1128.45      1.00
theta_base [ 6 ]      0.38      0.95      0.42     - 1.32      1.82   1026.50      1.00
theta_base [ 7 ]      0.10      0.97      0.10     - 1.51      1.65   1190.98      1.00

Number of divergences : 0

>> > pe = mcmc . get_extra_fields ()[ 'potential_energy' ]
>> > # Compare with the earlier value
>> > print ( 'Expected log joint density: {:.2f}' . format ( np . mean ( - pe )))  # doctest: +SKIP
Expected log joint density : - 46.09

Tenga en cuenta que para la clase de distribuciones con loc,scale como Normal , Cauchy , StudentT , también proporcionamos un reparador de LocScalereParam para lograr el mismo propósito. El código correspondiente será

 with numpyro.handlers.reparam(config={'theta': LocScaleReparam(centered=0)}):
    theta = numpyro.sample('theta', dist.Normal(mu, tau))

Ahora, supongamos que tenemos una nueva escuela para la cual no hemos observado ningún puntaje de prueba, pero nos gustaría generar predicciones. Numpyro proporciona una clase predictiva para tal propósito. Tenga en cuenta que en ausencia de cualquier datos observados, simplemente utilizamos los parámetros a nivel de población para generar predicciones. La utilidad Predictive condiciona los sitios mu y tau no observados a los valores extraídos de la distribución posterior de nuestra última ejecución de MCMC, y ejecuta el modelo hacia adelante para generar predicciones.

 >> > from numpyro . infer import Predictive

>> > # New School
... def new_school ():
...     mu = numpyro . sample ( 'mu' , dist . Normal ( 0 , 5 ))
...     tau = numpyro . sample ( 'tau' , dist . HalfCauchy ( 5 ))
...     return numpyro . sample ( 'obs' , dist . Normal ( mu , tau ))

>> > predictive = Predictive ( new_school , mcmc . get_samples ())
>> > samples_predictive = predictive ( random . PRNGKey ( 1 ))
>> > print ( np . mean ( samples_predictive [ 'obs' ]))  # doctest: +SKIP
3.9886456

Más ejemplos

Para algunos ejemplos más sobre especificar modelos y hacer inferencia en Numpyro:

Regresión bayesiana en Numpyro: comience aquí para familiarizarse con escribir un modelo simple en Numpyro, API de inferencia MCMC, controladores de efectos y escribir utilidades de inferencia personalizadas.
Pronóstico de series de tiempo: ilustra cómo convertir para bucles en el modelo a lax.scan primitivo de Jax para una inferencia rápida.
Ejemplos de anotación: ilustra cómo utilizar el mecanismo de enumeración para realizar una inferencia para modelos con variables latentes discretas.
Ejemplo de béisbol: usando nueces para un modelo jerárquico simple. Compare esto con el ejemplo de béisbol en Pyro.
Modelo oculto de Markov en Numpyro en comparación con STAN.
Autoencoder variacional: como un ejemplo simple que utiliza inferencia variacional con redes neuronales. Implementación de Pyro para comparación.
Proceso gaussiano: proporciona un ejemplo simple para usar nueces para probar desde el posterior sobre los hiperparametros de un proceso gaussiano.
Regresión de herradura: muestra cómo implementar modelos lineales generalizados equipados con una herradura anterior para salidas de valor binario y de valor real.
Repensar estadística con Numpyro: cuadernos que contienen la traducción del código en el libro de replanteamiento estadístico de Richard McElreath, a Numpyro.
Se pueden encontrar otros ejemplos de modelo en el sitio de ejemplos.

Los usuarios de PYRO notarán que la API para la especificación e inferencia del modelo es en gran medida lo mismo que Pyro, incluida la API de distribuciones, por diseño. Sin embargo, existen algunas diferencias centrales importantes (reflejadas en las partes internas) que los usuarios deben tener en cuenta. Por ejemplo, en Numpyro, no existe una tienda de parámetros global o un estado aleatorio, para que sea posible que aprovechemos la compilación JAT de Jax. Además, los usuarios pueden necesitar escribir sus modelos en un estilo más funcional que funcione mejor con Jax. Consulte las Preguntas frecuentes para obtener una lista de diferencias.

Descripción general de los algoritmos de inferencia

Proporcionamos una visión general de la mayoría de los algoritmos de inferencia compatibles con Numpyro y ofrecemos algunas pautas sobre qué algoritmos de inferencia pueden ser apropiados para diferentes clases de modelos.

MCMC

Las nueces, que es una variante adaptativa de HMC, es probablemente el algoritmo de inferencia más utilizado en Numpyro. Tenga en cuenta que las nueces y el HMC no son directamente aplicables a los modelos con variables latentes discretas, pero en los casos en que las variables discretas tienen soporte finito y resumirlas (es decir, enumeración) es manejable, Numpyro resumirá automáticamente variables latentes discretas y realiza nueces/HMC/HMC en las variables latentes continuas restantes. Como se discutió anteriormente, la reparameterización del modelo puede ser importante en algunos casos para obtener un buen rendimiento. Tenga en cuenta que, en términos generales, esperamos que la inferencia sea más difícil a medida que aumenta la dimensión del espacio latente. Vea el tutorial de geometría mala para obtener consejos y trucos adicionales.
MixedHMC puede ser una estrategia de inferencia efectiva para los modelos que contienen variables latentes continuas y discretas.
Los HMCEC pueden ser una estrategia de inferencia efectiva para modelos con una gran cantidad de puntos de datos. Es aplicable a modelos con variables latentes continuas. Vea aquí para un ejemplo.
Barkermh es un método MCMC basado en gradiente que puede ser competitivo con HMC y nueces para algunos modelos. Es aplicable a modelos con variables latentes continuas.
HMCGIBBS combina pasos HMC/Nuts con actualizaciones de Gibbs personalizadas. Las actualizaciones de Gibbs deben ser especificadas por el usuario.
DISCRETEHMCGIBBS combina pasos de HMC/Nuts con actualizaciones de Gibbs para variables latentes discretas. Las actualizaciones de Gibbs correspondientes se calculan automáticamente.
SA es el único método MCMC en Numpyro que no aprovecha los gradientes. Solo es aplicable a modelos con variables latentes continuas. Se espera que funcione mejor para los modelos cuya dimensión latente es baja a moderada. Puede ser una buena opción para los modelos con densidades de registro no diferenciables. Tenga en cuenta que SA generalmente requiere una gran cantidad de muestras, ya que la mezcla tiende a ser lenta. En el lado positivo, los pasos individuales pueden ser rápidos.

Al igual que HMC/Nuts, todos los algoritmos MCMC restantes respaldan la enumeración sobre variables latentes discretas si es posible (ver restricciones). Los sitios enumerados deben marcarse con infer={'enumerate': 'parallel'} como en el ejemplo de anotación.

Muestreo anidado

Nestedsampler ofrece un envoltorio para Jaxns. Consulte el ejemplo de Jaxns ReadThedocs para ver ejemplos y muestreo anidado para conchas gaussianas sobre cómo aplicar la muestra en los modelos Numpyro. Puede manejar modelos arbitrarios, incluidos los que con RV discretos y transformaciones no invertibles.

Inferencia variacional estocástica

Objetivos variacionales
- Trace_elbo es nuestra implementación básica de Elbo.
- TraceMeanfield_elbo es como Trace_ELBO pero calcula parte del Elbo analíticamente si es posible hacerlo.
- TraceGraph_elbo ofrece estrategias de reducción de varianza para modelos con variables latentes discretas. En términos generales, este elbo siempre debe usarse para modelos con variables latentes discretas.
- Traceenum_elbo ofrece estrategias de enumeración variable para modelos con variables latentes discretas. En términos generales, este elbo siempre debe usarse para modelos con variables latentes discretas cuando la enumeración es posible.
Guías automáticas (apropiadas para modelos con variables latentes continuas)
- Autonormal y autodiagonalnormal son nuestras guías básicas de campo medio. Si el espacio latente no es euclidiano (debido a por ejemplo, una restricción de positividad en uno de los sitios de muestra) una transformación bijectiva apropiada se usa automáticamente debajo del capó para mapear entre el espacio no restringido (donde se define la distribución variacional normal) a la correspondiente Espacio restringido (tenga en cuenta que esto es cierto para todas las guías automáticas). Estas guías son un excelente lugar para comenzar al tratar de obtener una inferencia variacional para trabajar en un modelo que está desarrollando.
- Automultivariatenormal y autolowrankmultivariatenormal también construye distribuciones variacionales normales, pero ofrece más flexibilidad, ya que pueden capturar correlaciones en el posterior. Tenga en cuenta que estas guías pueden ser difíciles de caber en la configuración de alta dimensión.
- Autodelta se usa para estimaciones de punto de computación a través de MAP (máxima estimación de posteriori). Vea aquí por ejemplo el uso.
- Oferta automática y autoiaiafnormal ofrece distribuciones de variaciones flexibles parametrizadas por normalización de flujos.
- AutoDais es un poderoso algoritmo de inferencia variacional que aprovecha HMC. Puede ser una buena opción para lidiar con los posteriores altamente correlacionados, pero puede ser computacionalmente costoso dependiendo de la naturaleza del modelo.
- AutoSurgatelikelihooddais es un poderoso algoritmo de inferencia variacional que aprovecha HMC y que admite el submuestreo de datos.
- AutoSemidais construye una aproximación posterior como AutoDais para variables latentes locales, pero proporciona soporte para el submuestreo de datos durante la capacitación Elbo mediante la utilización de una guía paramétrica para las variables latentes globales.
- AutolaplaceAproximation se puede usar para calcular una aproximación de Laplace.

Inferencia variacional de Stein

Vea los documentos para obtener más detalles.

Instalación

Soporte limitado de Windows: Tenga en cuenta que Numpyro no se ha probado en Windows y puede requerir construir Jaxlib desde la fuente. Vea este tema de Jax para más detalles. Alternativamente, puede instalar el subsistema de Windows para Linux y usar Numpyro en él como en un sistema Linux. Consulte también CUDA en el subsistema de Windows para Linux y esta publicación del foro si desea usar GPU en Windows.

Para instalar Numpyro con la última versión de CPU de Jax, puede usar PIP:

 pip install numpyro

En caso de que surjan problemas de compatibilidad durante la ejecución del comando anterior, puede forzar la instalación de una versión de CPU compatible conocida de Jax con

 pip install numpyro[cpu]

Para usar Numpyro en la GPU , primero debe instalar CUDA y luego usar el siguiente comando PIP:

 pip install numpyro[cuda] -f https://storage.googleapis.com/jax-releases/jax_cuda_releases.html

Si necesita más orientación, eche un vistazo a las instrucciones de instalación de JAX GPU.

Para ejecutar Numpyro en TPUS en la nube , puede ver algunos ejemplos de Jax en la TPU de la nube.

Para Cloud TPU VM, debe configurar el backend de TPU como se detalla en la guía Cloud TPU VM Jax QuickStart. Después de haber verificado que el backend de TPU está configurado correctamente, puede instalar Numpyro utilizando el comando pip install numpyro .

Plataforma predeterminada: Jax usará GPU de forma predeterminada si se instala el paquete jaxlib respaldado por CUDA. Puede usar SET_PLATFORM Utility numpyro.set_platform("cpu") para cambiar a CPU al comienzo de su programa.

También puede instalar numpyro desde la fuente:

 git clone https://github.com/pyro-ppl/numpyro.git
cd numpyro
# install jax/jaxlib first for CUDA support
pip install -e .[dev]  # contains additional dependencies for NumPyro development

También puede instalar numpyro con conda:

 conda install -c conda-forge numpyro

Preguntas frecuentes

A diferencia de Pyro, numpyro.sample('x', dist.Normal(0, 1)) no funciona. ¿Por qué?
Lo más probable es que esté utilizando una declaración numpyro.sample fuera de un contexto de inferencia. Jax no tiene un estado aleatorio global y, como tal, los muestreadores de distribución necesitan una clave explícita del generador de números aleatorios (PRNGKEY) para generar muestras desde. Los algoritmos de inferencia de Numpyro usan el controlador de semillas para enhebrar en una tecla de generador de números aleatorios, detrás de escena.
Tus opciones son:
- Llame a la distribución directamente y proporcione un PRNGKey , por ejemplo, dist.Normal(0, 1).sample(PRNGKey(0))
- Proporcione el argumento rng_key a numpyro.sample . por ejemplo numpyro.sample('x', dist.Normal(0, 1), rng_key=PRNGKey(0)) .
- Envuelva el código en un controlador seed , utilizado como administrador de contexto o en función que se envuelva sobre el invocado original. p.ej
```
 with handlers . seed ( rng_seed = 0 ):  # random.PRNGKey(0) is used
    x = numpyro . sample ( 'x' , dist . Beta ( 1 , 1 ))    # uses a PRNGKey split from random.PRNGKey(0)
    y = numpyro . sample ( 'y' , dist . Bernoulli ( x ))  # uses different PRNGKey split from the last one
```
  , o como una función de orden superior:
```
 def fn ():
    x = numpyro . sample ( 'x' , dist . Beta ( 1 , 1 ))
    y = numpyro . sample ( 'y' , dist . Bernoulli ( x ))
    return y

print ( handlers . seed ( fn , rng_seed = 0 )())
```
¿Puedo usar el mismo modelo Pyro para hacer inferencia en Numpyro?
Como puede haber notado en los ejemplos, Numpyro admite todas las primitivas de Pyro como sample , param , plate y module , y los manejadores de efectos. Además, hemos asegurado que la API de distribuciones se basa en torch.distributions , y las clases de inferencia como SVI y MCMC tienen la misma interfaz. Esto junto con la similitud en la API para las operaciones Numpy y Pytorch asegura que los modelos que contienen declaraciones Pyro primitivas se pueden usar con backend con algunos cambios menores. El ejemplo de algunas diferencias junto con los cambios necesarios se indican a continuación:
- Cualquier operación torch en su modelo deberá escribirse en términos de la operación jax.numpy correspondiente. Además, no todas las operaciones torch tienen una contraparte numpy (y viceversa), y a veces hay diferencias menores en la API.
- Las declaraciones pyro.sample fuera de un contexto de inferencia deberán envolverse en un controlador seed , como se mencionó anteriormente.
- No existe una tienda de parámetros globales y, como tal, usar numpyro.param fuera de un contexto de inferencia no tendrá ningún efecto. Para recuperar los valores de parámetros optimizados de SVI, use el método svi.get_params. Tenga en cuenta que aún puede usar las declaraciones param dentro de un modelo y Numpyro usará el controlador de efecto sustituto internamente para sustituir los valores del optimizador cuando ejecuta el modelo en SVI.
- Los módulos de red neuronal de Pytorch deberán reescribir como redes neuronales Stax, Flax o Haiku. Vea los ejemplos de VAE y Prodlda para las diferencias en la sintaxis entre los dos backends.
- Jax funciona mejor con el código funcional, particularmente si nos gustaría aprovechar la compilación JIT, que Numpyro hace internamente para muchas subrutinas de inferencia. Como tal, si su modelo tiene efectos secundarios que no son visibles para el Jax Tracer, es posible que necesite reescribir en un estilo más funcional.
Para la mayoría de los modelos pequeños, los cambios necesarios para ejecutar inferencia en Numpyro deberían ser menores. Además, estamos trabajando en Pyro-API, que le permite escribir el mismo código y enviarlo a múltiples backends, incluido Numpyro. Esto será necesariamente más restrictivo, pero tiene la ventaja de ser agnóstico de backend. Vea la documentación para obtener un ejemplo y háganos saber sus comentarios.
¿Cómo puedo contribuir al proyecto?
¡Gracias por su interés en el proyecto! Puede echar un vistazo a los problemas amigables para principiantes que están marcados con la buena etiqueta de primer problema en GitHub. Además, sienta que nos comunique con nosotros en el foro.

Futuro / trabajo continuo

En el corto plazo, planeamos trabajar en lo siguiente. Abra nuevos problemas para las solicitudes y mejoras de funciones:

Mejora de la robustez de la inferencia en diferentes modelos, perfiles y ajuste de rendimiento.
Admitiendo más funcionalidad como parte de la interfaz de modelado genérico Pyro-API.
Más algoritmos de inferencia, particularmente aquellos que requieren derivados de segundo orden o usan HMC.
Integración con Funsor para admitir algoritmos de inferencia con muestreo retrasado.
Otras áreas motivadas por los objetivos de investigación de Pyro y el enfoque de la aplicación, y el interés de la comunidad.

Citando numpyro

Las ideas motivadoras detrás de Numpyro y una descripción de las nueces iterativas se pueden encontrar en este documento que apareció en las transformaciones del programa Neurips 2019 para el taller de aprendizaje automático.

Si usa Numpyro, considere citar:

 @article{phan2019composable,
  title={Composable Effects for Flexible and Accelerated Probabilistic Programming in NumPyro},
  author={Phan, Du and Pradhan, Neeraj and Jankowiak, Martin},
  journal={arXiv preprint arXiv:1912.11554},
  year={2019}
}

así como

 @article{bingham2019pyro,
  author    = {Eli Bingham and
               Jonathan P. Chen and
               Martin Jankowiak and
               Fritz Obermeyer and
               Neeraj Pradhan and
               Theofanis Karaletsos and
               Rohit Singh and
               Paul A. Szerlip and
               Paul Horsfall and
               Noah D. Goodman},
  title     = {Pyro: Deep Universal Probabilistic Programming},
  journal   = {J. Mach. Learn. Res.},
  volume    = {20},
  pages     = {28:1--28:6},
  year      = {2019},
  url       = {http://jmlr.org/papers/v20/18-403.html}
}

Expandir

Información adicional

Versión 0.15.3
Tipo Otro código fuente
Fecha de actualización 2025-02-01
tamaño 19.18MB
Proviene de Github

Aplicaciones relacionadas

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
SmartTube

Otro código fuente

24.71 Stable
Sunamu

Otro código fuente

Release 2.2.0
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo