Para mí está claro, y bien explicado en múltiples sitios, qué información dan los valores en la diagonal de la matriz del sombrero para la regresión lineal.
La matriz del sombrero de un modelo de regresión logística es menos clara para mí. ¿Es idéntico a la información que obtiene de la matriz de sombreros aplicando regresión lineal? Esta es la definición de la matriz de sombreros que encontré en otro tema de CV (fuente 1):
con X, el vector de las variables predictoras y V es una matriz diagonal con .
¿Es, en otras palabras, también cierto que el valor particular de la matriz de sombreros de una observación también simplemente presenta la posición de las covariables en el espacio de covariables y no tiene nada que ver con el valor de resultado de esa observación?
Esto está escrito en el libro "Análisis de datos categóricos" de Agresti:
Cuanto mayor sea la palanca de una observación, mayor será su influencia potencial en el ajuste. Como en la regresión ordinaria, los apalancamientos caen entre 0 y 1 y suman la cantidad de parámetros del modelo. A diferencia de la regresión ordinaria, los valores del sombrero dependen tanto del ajuste como de la matriz del modelo, y los puntos que tienen valores predictores extremos no necesitan tener un alto apalancamiento.
Entonces, fuera de esta definición, ¿parece que no podemos usarlo como lo usamos en la regresión lineal ordinaria?
Fuente 1: ¿Cómo calcular la matriz del sombrero para la regresión logística en R?
fuente