¿Existe una interpretación bayesiana para REML?

14

¿Hay disponible una interpretación bayesiana de REML? Para mi intuición, REML tiene una gran similitud con los llamados procedimientos empíricos de estimación de Bayes , y me pregunto si se ha demostrado algún tipo de equivalencia asintótica (por ejemplo, bajo una clase adecuada de antecedentes). Tanto Bayes empíricos como REML parecen enfoques de estimación 'comprometidos' emprendidos frente a parámetros molestos , por ejemplo.

Principalmente, lo que busco con esta pregunta es la percepción de alto nivel que este tipo de argumentos tienden a producir. Por supuesto, si un argumento de esta naturaleza por alguna razón no puede ser útil para REML, ¡una explicación de por qué esto es así también brindaría una idea bienvenida!

David C. Norris
fuente
Este artículo parece ser relevante: Foulley J. (1993). Un argumento simple que muestra cómo derivar la probabilidad máxima restringida. J. Dairy Sci. 76, 2320–2324. 10.3168 / jds.S0022-0302 (93) 77569-4 sciencedirect.com/science/article/pii/...
DJW

Respuestas:

5

Las interpretaciones bayesianas existen solo dentro del marco del análisis bayesiano, para estimadores que se relacionan con una distribución posterior. Por lo tanto, la única forma en que el estimador REML podría recibir una interpretación bayesiana (es decir, una interpretación como un estimador tomado de la parte posterior) es si consideramos que la probabilidad de registro restringida en el análisis REML es el log-posterior en un correspondiente Análisis de Bayes; en este caso, el estimador REML sería un estimador MAP de la teoría bayesiana, con su correspondiente interpretación bayesiana.


x(θ,ν)=(θ,ν)+RE(θ)RE(θ)θνπ(θ,ν)exp((θ,ν))

π(θ|x)Lx(θ,ν)π(θ,ν)dνexp(x(θ,ν))exp((θ,ν))dν=exp(x(θ,ν)(θ,ν))dν=exp((θ,ν)+RE(θ)(θ,ν))dν=exp(RE(θ))dν=LRE(θ)dνLRE(θ).

Esto nos da:

θ^MAP=argmaxθπ(θ|x)=argmaxθLRE(θ)=θ^REML.

Este resultado nos permite interpretar el estimador REML como un estimador MAP, por lo que la interpretación bayesiana adecuada del estimador REML es que es el estimador el que maximiza la densidad posterior bajo el anterior anterior .

Después de ilustrar el método para dar una interpretación bayesiana al estimador REML, ahora observamos que hay algunos grandes problemas con este enfoque. Un problema es que lo anterior se forma utilizando el componente de probabilidad de registro , que depende de los datos. Por lo tanto, el "previo" necesario para obtener esta interpretación no es un previo real, en el sentido de ser una función que se puede formar antes de ver los datos. Otro problema es que lo anterior a menudo será incorrecto (es decir, no se integra a uno) y en realidad puede aumentar de peso a medida que los valores de los parámetros se vuelven extremos. (Mostraremos un ejemplo de esto a continuación).(θ,ν)

Con base en estos problemas, se podría argumentar que no existe una interpretación bayesiana razonable para el estimador REML. Alternativamente, se podría argumentar que el estimador REML aún mantiene la interpretación bayesiana anterior, siendo un estimador a posteriori máximo bajo un "previo" que debe coincidir casualmente con los datos observados en la forma especificada, y puede ser extremadamente incorrecto.


Ilustración con datos normales: El ejemplo clásico de estimación REML es para el caso de datos normales donde le interesa la precisión y la media es un parámetro molesto. En este caso tiene la función log-verosimilitud:θ νx1,...,xnN(ν,1/θ)θν

x(ν,θ)=n2lnθθ2i=1n(xiν)2.

En REML dividimos este log-verosimilitud en los dos componentes:

(ν,θ)=n2lnθθ2i=1n(xiν)2RE(θ)=n12lnθθ2i=1n(xix¯)2.

Obtenemos el estimador REML para el parámetro de precisión maximizando la probabilidad residual, lo que da un estimador imparcial para la varianza:

1θ^REML=1n1i=1n(xix¯)2.

En este caso, el estimador REML corresponderá a un estimador MAP para la densidad "anterior":

π(θ)θn/2exp(θ2i=1n(xiν)2).

Como puede ver, este "previo" en realidad depende de los valores de datos observados, por lo que no puede formarse antes de ver los datos. Además, podemos ver que es claramente un "impropio" anterior que pone cada vez más peso en los valores extremos de y . (En realidad, este prior es bastante loco.) Si por "coincidencia" formaras un prior que correspondiera a este resultado, entonces el estimador REML sería un estimador MAP bajo ese prior, y por lo tanto tendría una interpretación bayesiana como el estimador que maximiza la parte posterior debajo de la anterior.νθν

Ben - Restablece a Monica
fuente
3
¡Qué respuesta tan inmensamente clara! Siento que entiendo REML mucho mejor como resultado, que en gran medida era mi objetivo principal. Su enfoque al abrir su argumento parece haber sido esencialmente hacer la identificación, luego 'resolver' lo anterior. Luego procedes a demoler ese prior, que me parece una crítica (desde la perspectiva bayesiana) dirigida contra REML. ¡Muy bien hecho!
David C. Norris
3
Sí, ese es el método que utilicé. Por analogía, generalmente le damos al MLE una interpretación bayesiana por el mismo método, es decir, al descubrir que el MLE es el MAP bajo un uniforme previo. Entonces, en general, cuando queremos encontrar el análogo bayesiano a un estimador clásico que se forma mediante la maximización de alguna función, simplemente establecemos esa función en la parte posterior y luego resolvemos la anterior. Si esto da un previo sensato, entonces tenemos una buena interpretación bayesiana; Si lo anterior es una locura (como con REML), entonces tenemos un buen argumento de que no hay una buena interpretación bayesiana.
Ben - Restablece a Monica el