Considere un vector de parámetros , con θ 1 el parámetro de interés y θ 2 un parámetro molesto.
Si es la probabilidad construido a partir de los datos x , la probabilidad de perfil para θ 1 se define como L P ( θ 1 ; x ) = L ( θ 1 , θ 2 ( θ 1 ) ; x ) donde θ 2 ( θ 1 ) es el MLE de θ 2para un valor fijo de .
Maximizar la probabilidad de perfil con respecto a theta 1 conduce a misma estimación theta 1 como la obtenida mediante la maximización de la probabilidad al mismo tiempo con respecto a theta 1 y theta 2 .
Creo que la desviación estándar de θ 1 también puede estimarse a partir de la segunda derivada de la probabilidad de perfil.
La estadística de probabilidad para H 0 : θ 1 = θ 0 se puede escribir en términos de perfil de verosimilitud: L R = 2 log ( L P ( θ 1 ; x ).
Entonces, parece que la probabilidad de perfil se puede usar exactamente como si fuera una probabilidad real. ¿Es realmente el caso? ¿Cuáles son los principales inconvenientes de ese enfoque? ¿Y qué hay del "rumor" de que el estimador obtenido de la probabilidad del perfil está sesgado (editar: incluso asintóticamente)?
Respuestas:
La estimación de partir de la probabilidad de perfil es solo el MLE. Maximizar con respecto a θ 2 para cada posible θ 1 y luego maximizar con respecto a θ 1 es lo mismo que maximizar con respecto a ( θ 1 , θ 2 ) conjuntamente.θ1 θ2 θ1 θ1 (θ1,θ2)
La principal debilidad es que, si basa su estimación de la SE de θ 1 de la curvatura del perfil de riesgo, que no está totalmente de contabilidad para la incertidumbre en θ 2 .θ^1 θ2
McCullagh y Nelder, Modelos lineales generalizados, segunda edición , tiene una sección corta sobre la probabilidad de perfil (Sección 7.2.4, páginas 254-255). Ellos dicen:
fuente