¿Cuáles son las desventajas de la probabilidad de perfil?

19

Considere un vector de parámetros , con θ 1 el parámetro de interés y θ 2 un parámetro molesto.(θ1,θ2)θ1θ2

Si es la probabilidad construido a partir de los datos x , la probabilidad de perfil para θ 1 se define como L P ( θ 1 ; x ) = L ( θ 1 , θ 2 ( θ 1 ) ; x ) donde θ 2 ( θ 1 ) es el MLE de θ 2L(θ1,θ2;x)xθ1LP(θ1;x)=L(θ1,θ^2(θ1);x)θ^2(θ1)θ2para un valor fijo de .θ1

Maximizar la probabilidad de perfil con respecto a theta 1 conduce a misma estimación theta 1 como la obtenida mediante la maximización de la probabilidad al mismo tiempo con respecto a theta 1 y theta 2 .θ1θ^1θ1θ2

Creo que la desviación estándar de θ 1 también puede estimarse a partir de la segunda derivada de la probabilidad de perfil.θ^1

La estadística de probabilidad para H 0 : θ 1 = θ 0 se puede escribir en términos de perfil de verosimilitud: L R = 2 log ( L P ( θ 1 ; x )H0:θ1=θ0.LR=2log(LP(θ^1;x)LP(θ0;x))

Entonces, parece que la probabilidad de perfil se puede usar exactamente como si fuera una probabilidad real. ¿Es realmente el caso? ¿Cuáles son los principales inconvenientes de ese enfoque? ¿Y qué hay del "rumor" de que el estimador obtenido de la probabilidad del perfil está sesgado (editar: incluso asintóticamente)?

ocram
fuente
2
solo una nota, los estimadores de la probabilidad también pueden estar sesgados, el ejemplo clásico es la estimación de la varianza de probabilidad para la muestra normal.
mpiktas
@mpiktas: Gracias por tu comentario. De hecho, el mle clásico también puede estar sesgado. Editaré la pregunta para aclarar las cosas.
ocram
¿Cuál es el sesgo asintótico? ¿Estás hablando de estimadores no consistentes?
mpiktas
@mpiktas: Sí, esto es lo que debería haber dicho ...
ocram

Respuestas:

14

La estimación de partir de la probabilidad de perfil es solo el MLE. Maximizar con respecto a θ 2 para cada posible θ 1 y luego maximizar con respecto a θ 1 es lo mismo que maximizar con respecto a ( θ 1 , θ 2 ) conjuntamente.θ1θ2θ1θ1(θ1,θ2)

La principal debilidad es que, si basa su estimación de la SE de θ 1 de la curvatura del perfil de riesgo, que no está totalmente de contabilidad para la incertidumbre en θ 2 .θ^1θ2

McCullagh y Nelder, Modelos lineales generalizados, segunda edición , tiene una sección corta sobre la probabilidad de perfil (Sección 7.2.4, páginas 254-255). Ellos dicen:

[A] se pueden obtener conjuntos de confianza aproximados de la manera habitual ... tales intervalos de confianza a menudo son satisfactorios si [la dimensión de ] es pequeña en relación con la información total de Fisher, pero de lo contrario puede ser engañosa. Lamentablemente [la probabilidad de registro de perfil] no es una función de probabilidad de registro en el sentido habitual. Obviamente, su derivada no tiene media cero, una propiedad que es esencial para estimar ecuaciones.θ2

Karl
fuente
Muchas gracias por su respuesta. Antes de aceptarlo, déjame preguntarte algo más. ¿Cuáles son las implicaciones de ? ElP(θ1)θ10
ocram
Pregunta interesante, aunque requirió un viaje a la estantería (que debería haber hecho de todos modos). He agregado un poco a mi respuesta sobre este punto.
Karl
Muchas gracias por la edición. Se dice que la propiedad (la puntuación evaluada en el valor del parámetro verdadero tiene media cero) es esencial para estimar ecuaciones. Pero aunque la probabilidad de registro del perfil no cumple con esa propiedad, sí produce el MLE. ¿Hay algo que extraño?
ocram
Esa propiedad no es necesaria para proporcionar el MLE.
Karl