¿Igual o diferente? El camino bayesiano

Digamos que tengo el siguiente modelo:

Poisson (λ) \sim {\begin{cases} λ_{1} & if t < τ \\ λ_{2} & if t \geq τ \end{cases}

$\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases}$

Y deduzco los datos posteriores para y muestran a continuación a partir de mis datos. ¿Hay alguna forma bayesiana de decir (o cuantificar) si y son iguales o diferentes ? $\lambda_1$ $\lambda_2$ $\lambda_1$ $\lambda_2$

¿Quizás medir la probabilidad de que sea diferente de $\lambda_1$ $\lambda_2$ ? ¿O tal vez usando divergencias KL?

Por ejemplo, ¿cómo puedo medir , o al menos, ? $p(\lambda_2 \neq \lambda_1)$ $p(\lambda_2 \gt \lambda_1)$

En general, una vez que tenga las partes posteriores que se muestran a continuación (suponga valores PDF distintos de cero en todas partes para ambos), ¿cuál es una buena manera de responder esta pregunta?

ingrese la descripción de la imagen aquí

Actualizar

Parece que esta pregunta se puede responder de dos maneras:

Si tenemos muestras de los posteriores, podríamos mirar la fracción de las muestras donde (o equivalente ). @ Cam.Davidson.Pilon incluyó una respuesta que abordaría este problema utilizando tales muestras. $\lambda_1 \neq \lambda_2$ $\lambda_2 > \lambda_1$
Integrando algún tipo de diferencia de las posteriores. Y esa es una parte importante de mi pregunta. ¿Cómo sería esa integración? Presumiblemente, el enfoque de muestreo se aproximaría a esta integral, pero me gustaría saber la formulación de esta integral.

Nota: Las parcelas anteriores provienen de este material .

distributions bayesian poisson-distribution Amelio Vazquez-Reina
fuente

Puede calcular la varianza de ambas distribuciones y agregarlas. Esa es la varianza de la diferencia en las medias. Luego calcule la diferencia en las medias y vea cuántas desviaciones estándar es. Puede aproximar ambas distribuciones con normal para comenzar y utilizar los intervalos de confianza habituales para una distribución normal. Son medios claramente diferentes.

Dave31415

La prueba de hipótesis intrínseca es una respuesta

Stéphane Laurent

Todos los cálculos requeridos se proporcionan en mi trabajo, pero no he estudiado el caso de

(

es la relación de las dos tasas de Poisson)

H_{0} : {ϕ = 1}

$H_0:\{\phi=1\}$

ϕ

$\phi$

Stéphane Laurent

Gracias @ StéphaneLaurent. Su artículo es un gran indicador, pero parece ser específico para los procesos de Poisson. ¿Cuál es la comparación, en un nivel alto, que un Bayesiano puede hacer para estimar si

es igual o diferente de

? ¿El análisis tiene que ser específico de distribución?

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

Amelio Vazquez-Reina

Lo siento @ user023472 No tengo energía en estos días. Ver los documentos de Bernardo citados en mi artículo. "Intrínseco" significa que el método se deriva y solo del modelo.

Stéphane Laurent

Respuestas:

Creo que una mejor pregunta es, ¿ son significativamente diferentes?

Para responder a esto, necesitamos calcular . Llamar a esta cantidad . Si , entonces hay la misma posibilidad de que uno sea más grande que el otro. Por otro lado, si está realmente cerca de 1, entonces podemos estar seguros de que sí es más grande (léase: diferente) que . $P(\lambda_2 > \lambda_1)$ $p$ $p \approx 0.50$ $p$ $\lambda_2$ $\lambda_1$

¿Cómo calculamos ? Es trivial en un marco Bayesian MCMC. Tenemos muestras de la parte posterior, así que simplemente calculemos el número de veces que las muestras de son más grandes que : $p$ $\lambda_2$ $\lambda_1$

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Pido disculpas por no incluir esto en el libro, definitivamente lo agregaré, ya que creo que es una de las ideas más útiles en la inferencia bayesiana

Cam.Davidson.Pilon
fuente

La probabilidad es 1.0 son diferentes, ya que ambas son variables aleatorias continuas. Considere: ¿cuál es su suposición previa de que

? ¿De verdad crees que son realmente iguales? (Ignore las pruebas de hipótesis: estamos viviendo en el mundo real donde las variables nunca son realmente iguales). Ver esta publicación de mi héroe, Gelman. Computacionalmente, puedes probar esto computando .

λ_{1} = λ_{2}

$\lambda_1 = \lambda_2$ np.mean( lambda_2_samples != lambda_1_samples)

Cam.Davidson.Pilon

P (| λ_{1} - λ_{2} | > 1)

$P(|\lambda_1-\lambda_2| > 1)$

P (λ_{1} \neq λ_{2})

$P(\lambda_1 \ne \lambda_2)$

λ_{1}

$\lambda_1$

λ_{2}

$\lambda_2$

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

¡Dios mío, odiaría estar en esa situación! Implica integrales desagradables. Para la mayoría de los modelos, no puede derivar los posteriores. Incluso si pudiera, podría ser mejor usar una computadora, solo por obtener muestras. En resumen, muestras> fórmulas para cálculos como este.

Cam.Davidson.Pilon

No estás midiendo "suficientemente grande". Considere una distribución con un pico en cero y otra con masas iguales en los picos -10, 10. Su estadística, el valor esperado del indicador de que una muestra es más grande que la otra, da 0.5, pero las distribuciones son claramente totalmente diferentes.

Neil G

$\lambda_1$ $\lambda_2$ $\Pr(\lambda_1=\lambda_2)=0$

Sospecho que está interesado en la probabilidad de que y estén dentro de algún uno del otro. En ese caso, el área de la diferencia en las dos densidades posteriores en el intervalo es su respuesta. Los valores más grandes de superposición indican que los dos posteriores son más similares. $\lambda_1$ $\lambda_2$ $\epsilon$ $[-\epsilon/2, \epsilon/2]$

Si prefiere trabajar con resultados simulados (y para la mayoría de los problemas, no tenemos el lujo de elegir), simplemente tome la proporción de los resultados donde como una aproximación. $\lambda_2>\lambda_1$

Sycorax dice reinstalar a Mónica
fuente

Gracias. ¿Cómo se relaciona su respuesta con algunas de las ideas discutidas en los comentarios del OP?

Amelio Vazquez-Reina

Disculpas, pero no estoy familiarizado con ninguno de esos métodos, así que no puedo comentar significativamente. Sin embargo, @ Stéphane_Laurent es bastante inteligente, por lo que recomiendo mirar a través del enlace, como mínimo.

Sycorax dice Reinstate Monica

@ user023472 Lo siento, no tengo la energía para responder hoy sobre el enfoque de discrepancia intrínseca. Se basa en la divergencia Kullback-Leibler.

Stéphane Laurent

@ user777 Esto requiere reparación . ¿Qué si solo quiero ver la probabilidad o ?

ϵ

$\epsilon$

p (λ_{2} > λ_{1})

$p(\lambda_2 \gt \lambda_1)$

p (λ_{2} \neq λ_{1})

$p(\lambda_2 \neq \lambda_1)$

Amelio Vazquez-Reina

Gracias @ user777. Estoy interesado en el caso cuando no tenemos acceso a las muestras. Tuviste una integral en tu publicación anterior, pero parece que la has eliminado. ¿Cómo sería esa integral?

Amelio Vazquez-Reina