Esta pregunta está motivada por esta . Busqué dos fuentes y esto es lo que encontré.
A. van der Vaart, Estadísticas asintóticas:
Rara vez es posible calcular explícitamente la probabilidad de un perfil, pero su evaluación numérica a menudo es factible. Entonces, la probabilidad de perfil puede servir para reducir la dimensión de la función de probabilidad. Las funciones de probabilidad de perfil a menudo se usan de la misma manera que las funciones de probabilidad (ordinarias) de los modelos paramétricos. Aparte de tomar sus puntos de máxima como estimadores theta , la segunda derivada en θ se utiliza como una estimación de menos la inversa de la matriz de covarianza asintótica de e. Investigaciones recientes parecen validar esta práctica.
J. Wooldridge, Análisis econométrico de sección transversal y datos de panel (lo mismo en ambas ediciones):
Como dispositivo para estudiar las propiedades asintóticas, la función objetivo concentrada es de valor limitado porque
Wooldridge analiza el problema en un contexto más amplio de estimadores M, por lo que también se aplica a los estimadores de máxima verosimilitud.
Entonces obtenemos dos respuestas diferentes para la misma pregunta. El diablo en mi opinión está en los detalles. Para algunos modelos, podemos usar la probabilidad de hessian de perfil de forma segura para algunos modelos que no lo son. ¿Hay resultados generales que den condiciones cuando podemos hacer eso (o no podemos)?
Respuestas:
Desafortunadamente, eso es cierto por ahora y es poco probable que cambie.
La discusión más clara de la que tengo conocimiento es Las reglas de la inferencia condicional: ¿existe una definición universal de no-formación? B Jørgensen - Métodos y aplicaciones estadísticas, 1994.
Y para algunos de los problemas específicos de abordar las fallas de probabilidad de perfil Stafford, JE (1996). Un ajuste robusto de la probabilidad de perfil, Annals of Statistics, 24, 336-52.
fuente
Una respuesta rápida: Esto se discute en el capítulo tres de OE Barndorff-Nielsen y DR Cox: Inferencia y asintóticas, Chapman & Hall, página 90, ecuación 3.31, que atribuyen a Patefield. Concluyen que para un parámetro escalar esto es válido (no analizan otros casos).
fuente