¿Puede una probabilidad adecuada anterior y exponencial conducir a una posterior incorrecta?

11

(Esta pregunta está inspirada en este comentario de Xi'an ).

Es bien sabido que si la distribución anterior es adecuada y la probabilidad está bien definida, entonces la distribución posterior es apropiado casi con seguridad.π(θ)L(θ|x)π(θ|x)π(θ)L(θ|x)

En algunos casos, utilizamos en cambio una probabilidad moderada o exponencial, que conduce a un pseudo-posterior

π~(θ|x)π(θ)L(θ|x)α
para algunos (por ejemplo, esto puede tener ventajas computacionales).α>0

En este contexto, ¿es posible tener un pseudo-posterior adecuado pero incorrecto?

Robin Ryder
fuente
2
De hecho, unos minutos más tarde, consideraría poco probable, ya que la divergencia del producto de probabilidad x anterior se reduce al considerar el producto de probabilidad x anterior ^ α ... ¡Cualquier tern que vaya al infinito irá allí más lentamente! Y los términos que van a cero más lentamente están controlados por el previo adecuado. Mi apuesta es que esto es imposible. (advertencia: ¡se sabe que estoy equivocado!)
Xi'an
1
Posiblemente útil para buscar un contraejemplo cuando : la desigualdad de Markov nos dice que Entonces, si puede encontrar un caso en el que tenga colas polinomiales, entonces posiblemente pueda construir un pseudo-posterior incorrecto. α>1
Eθπ[L(x|θ)α]tαPθπ(L(x|θ)>t)Eθπ[L(x|θ)α]supt>0tαPθπ(L(x|θ)>t)
L(x|θ)
πr8
¿Funcionaría este argumento también para ? Además, ¿hay alguna manera de demostrar que una probabilidad construida de esta manera sería adecuada? α<1
InfProbSciX
1
En realidad, para , ya que sabemos que , el supremum en el RHS siempre es finito, y para , uno usa su argumento Jensen para hacer la misma deducción. Entonces el argumento falla a ese respecto. Una pequeña observación de que este argumento requiere una probabilidad ilimitada para tener éxito, es decir, para todo . α=1Eπ[L(x|θ)]<α<1LPπ(L(x|θ)>t)>0t
πr8
1
Es cierto que para , no puedes construir uno, ¡buen punto! Debo decir que me fascinaría ver un ejemplo de una probabilidad ilimitada. Quizás una beta posterior sería el resultado de una probabilidad ilimitada. α=1
InfProbSciX

Respuestas:

7

Para , ¿tal vez este es un argumento para demostrar que es imposible construir tal posterior?α1

Nos gustaría saber si es posible para .π~(θ|x)dθ=

En el RHS:

π(θ)Lα(θ|x)dθ=Eθ(Lα(θ|x))

Si , es una función cóncava, por la desigualdad de Jensen:α1xα

Eθ(Lα(θ|x))Eθα(L(θ|x))=m(x)α<

... donde como Xi'an señaló, es la constante de normalización (la evidencia).m(x)

InfProbSciX
fuente
Genial, gracias. Me gusta que estés usando el hecho de que para lo posterior es apropiado. α=1
Robin Ryder
1

Es posible usar el resultado en la respuesta de @ InfProbSciX para probar el resultado en general. Reescribe como Si , tenemos el caso de desigualdad de Jensen anterior, ya que sabemos que es normalizable. Del mismo modo, si , podemos escribir con , cayendo nuevamente en el mismo caso, ya que sabemos que es normalizable. Ahora se puede usar la inducción (fuerte) para mostrar el caso en general.L(θx)απ(θ)

L(θx)α1L(θx)π(θ).
1α2L(x|θ)π(θ)2α3
L(x|θ)αpL(x|θ)pπ(θ),
1p2L(x|θ)pπ(θ)

Comentarios antiguos

No estoy seguro de si esto es súper útil, pero como no puedo comentar, dejaré esto en una respuesta. Además del excelente comentario de @ InfProbSciX acerca de , si uno asume que , entonces es imposible tener un pseudo-posterior adecuado pero incorrecto para . Por ejemplo, si sabemos que existe el segundo momento ( -ésimo) de , sabemos que está en ( ) y, por lo tanto, el pseudo-posterior será apropiado para . Sección 1 en estas notasα1L(θx)Lp1<αppL(θx)L2Lp0α2entra un poco más en detalles, pero desafortunadamente no está claro qué tan amplia es la clase de, digamos, pdfs. Pido disculpas si estoy hablando fuera de turno aquí, realmente quería dejar esto como un comentario.L10

Luiz Max Carvalho
fuente
1
Tienes razón, si la función de probabilidad está dentro del espacio , es decir, el espacio la medida inducida por el anterior, entonces el posterior será apropiado para . Estoy completamente adivinando aquí, pero creo que el espacio abarcaría la mayoría de las posibilidades en las que podemos pensar: creo que podría haber leído una prueba hace mucho tiempo que dice que si es Riemann integrable, entonces sus poderes positivos también lo son. embargo es integrable. Teorema 1.26 para referenciaL(θ|x)Lp(πθ)Lp1αpffn,nZ+
InfProbSciX
@InfProbSciX, creo que podría haber una prueba completa al acecho en las sombras aquí. De su respuesta deduzco que puede ser negativo. Si eso es correcto, entonces podemos mostrar que para cualquier la pseudo-verosimilitud será integrable porque los recíprocos de las funciones integrables son integrables. Y si la probabilidad es integrable, sostengo que lo posterior será integrable porque lo anterior está limitado, y el producto de una función integrable y limitada es integrable ( math.stackexchange.com/a/56008/271610 ). Déjame saber lo que piensas. αp>1
Luiz Max Carvalho
1
Creo que puede ignorar el caso donde , ya que la pregunta asume explícitamente lo contrario. Es necesario mostrar la integrabilidad de para cualquier caso general. Además, no estoy seguro de si lo anterior siempre está limitado, por ejemplo, la densidad de un no lo estaría. α<0LαBeta(0.5,0.5)
InfProbSciX
@InfProbSciX, lo que quise decir es que incluso si no está en la pregunta, si su prueba también es válida para esa condición, entonces podríamos mostrar integrabilidad para al aprovechar el hecho de que si es integrable, entonces es . Como usted dice, todo eso es nulo si lo anterior no tiene límites. Podemos tratar de limitar la probabilidad en su lugar y me parece que cualquier probabilidad que uno usaría en MLE tendría que estar delimitada o fuertemente cóncava ( en.wikipedia.org/wiki/Maximum_likelihood_estimation#Properties ), las cuales se pueden usar para Construir una prueba general. ¿Alguna idea? α<0α>1f1/f
Luiz Max Carvalho
Lo siento, me perdí eso, sí, ¡parece que sería un intento interesante!
InfProbSciX