¿Alguien puede decirme cómo interpretar los gráficos de 'residuales vs ajustados', 'q-q normal', 'ubicación de escala' y 'residuales vs apalancamiento'? Estoy ajustando un GLM binomial, guardándolo y luego trazándolo.
30
¿Alguien puede decirme cómo interpretar los gráficos de 'residuales vs ajustados', 'q-q normal', 'ubicación de escala' y 'residuales vs apalancamiento'? Estoy ajustando un GLM binomial, guardándolo y luego trazándolo.
Respuestas:
R
No tiene unplot.glm()
método distinto . Cuando ajusta un modelo conglm()
y lo ejecutaplot()
, llama a ? Plot.lm , que es apropiado para modelos lineales (es decir, con un término de error normalmente distribuido).En general, el significado de estas parcelas (al menos para modelos lineales) se puede aprender en varios hilos existentes en CV (por ejemplo: Residuales versus ajustados ; parcelas qq en varios lugares: 1 , 2 , 3 ; Ubicación de escala ; Residuos vs apalancamiento ). Sin embargo, esas interpretaciones generalmente no son válidas cuando el modelo en cuestión es una regresión logística.
Más específicamente, las tramas a menudo se 'verán graciosas' y llevarán a la gente a creer que hay algo mal con el modelo cuando está perfectamente bien. Podemos ver esto mirando esas parcelas con un par de simulaciones simples donde sabemos que el modelo es correcto:
Ahora veamos las parcelas que obtenemos de
plot.lm()
:Parece que tanto los gráficos como
Residuals vs Fitted
losScale-Location
gráficos tienen problemas con el modelo, pero sabemos que no hay ninguno. Estas gráficas, destinadas a modelos lineales, a menudo simplemente son engañosas cuando se usan con un modelo de regresión logística.Veamos otro ejemplo:
Ahora todas las tramas se ven extrañas.
Entonces, ¿qué te muestran estas tramas?
Residuals vs Fitted
trama puede ayudarlo a ver, por ejemplo, si hay tendencias curvilíneas que se perdió. Pero el ajuste de una regresión logística es curvilíneo por naturaleza, por lo que puede tener tendencias de aspecto extraño en los residuos sin nada malo.Normal Q-Q
gráfico le ayuda a detectar si sus residuos se distribuyen normalmente. Pero los residuos de desviación no tienen que distribuirse normalmente para que el modelo sea válido, por lo que la normalidad / no normalidad de los residuos no necesariamente le dice nada.Scale-Location
trama puede ayudarlo a identificar la heterocedasticidad. Pero los modelos de regresión logística son bastante heterocedásticos por naturaleza.Residuals vs Leverage
puede ayudarlo a identificar posibles valores atípicos. Pero los valores atípicos en la regresión logística no necesariamente se manifiestan de la misma manera que en la regresión lineal, por lo que este gráfico puede o no ser útil para identificarlos.La lección simple para llevar a casa aquí es que estos gráficos pueden ser muy difíciles de usar para ayudarlo a comprender lo que está sucediendo con su modelo de regresión logística. Probablemente sea mejor que las personas no vean estas tramas en absoluto cuando ejecutan una regresión logística, a menos que tengan una experiencia considerable.
fuente
Lea más sobre los supuestos de regresión, ya que en muchos aspectos hay similares (por ejemplo , aquí , o tutorial sobre regresión en R aquí ).
fuente