Interpretación de la trama (glm.model)

¿Alguien puede decirme cómo interpretar los gráficos de 'residuales vs ajustados', 'q-q normal', 'ubicación de escala' y 'residuales vs apalancamiento'? Estoy ajustando un GLM binomial, guardándolo y luego trazándolo.

r logistic data-visualization generalized-linear-model qq-plot Verano
fuente

¿Sabes cómo interpretar esas tramas cuando se trata de una regresión lineal regular? Porque ese debería ser tu punto de partida.

Steve S

Respuestas:

RNo tiene un plot.glm()método distinto . Cuando ajusta un modelo con glm()y lo ejecuta plot(), llama a ? Plot.lm , que es apropiado para modelos lineales (es decir, con un término de error normalmente distribuido).

En general, el significado de estas parcelas (al menos para modelos lineales) se puede aprender en varios hilos existentes en CV (por ejemplo: Residuales versus ajustados ; parcelas qq en varios lugares: 1 , 2 , 3 ; Ubicación de escala ; Residuos vs apalancamiento ). Sin embargo, esas interpretaciones generalmente no son válidas cuando el modelo en cuestión es una regresión logística.

Más específicamente, las tramas a menudo se 'verán graciosas' y llevarán a la gente a creer que hay algo mal con el modelo cuando está perfectamente bien. Podemos ver esto mirando esas parcelas con un par de simulaciones simples donde sabemos que el modelo es correcto:

  # we'll need this function to generate the Y data:
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

set.seed(10)                    # this makes the simulation exactly reproducible
x  = runif(20, min=0, max=10)   # the X data are uniformly distributed from 0 to 10
lo = -3 + .7*x                  # this is the true data generating process
p  = lo2p(lo)                   # here I convert the log odds to probabilities
y  = rbinom(20, size=1, prob=p) # this generates the Y data

mod = glm(y~x, family=binomial) # here I fit the model
summary(mod)                    # the model captures the DGP very well & has no
# ...                           #  obvious problems:
# Deviance Residuals: 
#      Min        1Q    Median        3Q       Max  
# -1.76225  -0.85236  -0.05011   0.83786   1.59393  
# 
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)  
# (Intercept)  -2.7370     1.4062  -1.946   0.0516 .
# x             0.6799     0.3261   2.085   0.0371 *
# ...
# 
# Null deviance: 27.726  on 19  degrees of freedom
# Residual deviance: 21.236  on 18  degrees of freedom
# AIC: 25.236
# 
# Number of Fisher Scoring iterations: 4

Ahora veamos las parcelas que obtenemos de plot.lm():

ingrese la descripción de la imagen aquí

Parece que tanto los gráficos como Residuals vs Fittedlos Scale-Locationgráficos tienen problemas con el modelo, pero sabemos que no hay ninguno. Estas gráficas, destinadas a modelos lineales, a menudo simplemente son engañosas cuando se usan con un modelo de regresión logística.

Veamos otro ejemplo:

set.seed(10)
x2 = rep(c(1:4), each=40)                    # X is a factor with 4 levels
lo = -3 + .7*x2
p  = lo2p(lo)
y  = rbinom(160, size=1, prob=p)

mod = glm(y~as.factor(x2), family=binomial)
summary(mod)                                 # again, everything looks good:
# ...
# Deviance Residuals: 
#   Min       1Q   Median       3Q      Max  
# -1.0108  -0.8446  -0.3949  -0.2250   2.7162  
# 
# Coefficients:
#                Estimate Std. Error z value Pr(>|z|)    
# (Intercept)      -3.664      1.013  -3.618 0.000297 ***
# as.factor(x2)2    1.151      1.177   0.978 0.328125    
# as.factor(x2)3    2.816      1.070   2.632 0.008481 ** 
# as.factor(x2)4    3.258      1.063   3.065 0.002175 ** 
# ... 
# 
# Null deviance: 160.13  on 159  degrees of freedom
# Residual deviance: 133.37  on 156  degrees of freedom
# AIC: 141.37
# 
# Number of Fisher Scoring iterations: 6

ingrese la descripción de la imagen aquí

Ahora todas las tramas se ven extrañas.

Entonces, ¿qué te muestran estas tramas?

La Residuals vs Fittedtrama puede ayudarlo a ver, por ejemplo, si hay tendencias curvilíneas que se perdió. Pero el ajuste de una regresión logística es curvilíneo por naturaleza, por lo que puede tener tendencias de aspecto extraño en los residuos sin nada malo.
El Normal Q-Qgráfico le ayuda a detectar si sus residuos se distribuyen normalmente. Pero los residuos de desviación no tienen que distribuirse normalmente para que el modelo sea válido, por lo que la normalidad / no normalidad de los residuos no necesariamente le dice nada.
La Scale-Locationtrama puede ayudarlo a identificar la heterocedasticidad. Pero los modelos de regresión logística son bastante heterocedásticos por naturaleza.
El Residuals vs Leveragepuede ayudarlo a identificar posibles valores atípicos. Pero los valores atípicos en la regresión logística no necesariamente se manifiestan de la misma manera que en la regresión lineal, por lo que este gráfico puede o no ser útil para identificarlos.

La lección simple para llevar a casa aquí es que estos gráficos pueden ser muy difíciles de usar para ayudarlo a comprender lo que está sucediendo con su modelo de regresión logística. Probablemente sea mejor que las personas no vean estas tramas en absoluto cuando ejecutan una regresión logística, a menos que tengan una experiencia considerable.

gung - Restablece a Monica
fuente

Buena pena, esta es una respuesta increíble.

d8aninja

@gung ¿Podría decir qué podemos hacer si es una película? ¿Existe una alternativa a QQ, Residual vs Fitted? Por ejemplo, tracé un enlace GLM de Poisson, pero no sé cómo analizar si encaja bien

GRS

@GRS, intenta leer esto .

gung - Restablece a Monica

@Todas sus respuestas son detalladas y claras. Además de leer de múltiples fuentes, incluido este sitio, ¿puede referir uno o dos buenos libros / sitios para obtener 'experiencia considerable' en la comprensión de las parcelas de diagnóstico? Entiendo que pocas habilidades podemos obtener solo con la práctica y la experiencia, pero si algún libro / sitio web en particular que cubra los detalles en profundidad si puede referirlo, sería de gran ayuda.

Dra. Nisha Arora

@DrNishaArora, no realmente que yo sepa. Hay algunos libros que son relevantes para LR, pero no van a pasar mucho tiempo en estas parcelas, por las razones indicadas.

Gung

Residuales vs ajustados: no debe haber patrones fuertes (los patrones leves no son un problema, vea la respuesta de @ gung) y no hay valores atípicos, los residuos deben distribuirse aleatoriamente alrededor de cero.
QQ normal: los residuos deben ir alrededor de la línea diagonal, es decir, deben distribuirse normalmente (ver wiki para el gráfico QQ ). Este diagrama ayuda a verificar si son aproximadamente normales.
Ubicación de escala: como puede ver, en el eje Y también hay residuos (como en el gráfico Residuals vs ajustado), pero están escalados, por lo que es similar a (1), pero en algunos casos funciona mejor.
Residuos vs apalancamiento: ayuda a diagnosticar casos periféricos. Como en las parcelas anteriores, los casos periféricos están numerados, pero en esta gráfica, si hay casos que son muy diferentes del resto de los datos, se grafican debajo de líneas rojas finas (consulte wiki en la distancia de Cook ).

Lea más sobre los supuestos de regresión, ya que en muchos aspectos hay similares (por ejemplo , aquí , o tutorial sobre regresión en R aquí ).

Tim
fuente

Esta respuesta es incorrecta en el contexto de glm, también presentada por @gung, en la respuesta anterior. Si está buscando una respuesta a esta pregunta, IGNORE ESTA RESPUESTA. Si usted es el autor de esta respuesta, consulte la respuesta anterior de gung. Si está de acuerdo, debe considerar eliminar esta respuesta, ya que es engañosa.

colin

@colin ¿le gustaría comentar qué es exactamente lo que está mal en su opinión con esta respuesta? La única diferencia entre la mía y la segunda respuesta es que el gung entra en más detalles ...

Tim

Usted describe cómo se deben usar estos gráficos en el contexto de la regresión lineal. Gung describe por qué estas interpretaciones fallan en este caso, porque se están aplicando a un modelo binomial glm. Entonces, si un usuario interpretó estas gráficas de diagnóstico como usted sugiere (y sus sugerencias serían útiles en un caso de lm), concluirán erróneamente que su modelo viola los supuestos de glm, cuando en realidad no lo hace.

Colin

usted escribe, "Residuales vs ajustados: no debe haber patrones ni valores atípicos, los residuos deben distribuirse aleatoriamente alrededor de 0". Gung escribe: "La trama Residuals vs Fitted puede ayudarlo a ver, por ejemplo, si hay tendencias curvilíneas que se perdió. Pero el ajuste de una regresión logística es curvilíneo por naturaleza, por lo que puede tener tendencias de aspecto extraño en los residuos sin nada mal." ... uno de ustedes debe estar equivocado.

Colin

Estoy de acuerdo, esto no es en blanco y negro, pero hay muchos casos en los que HAY tendencias fuertes, pero el modelo especificado es totalmente apropiado bajo los supuestos de la película específica. Por lo tanto, afirmando, "no debe haber patrones ni valores atípicos, los residuos deben distribuirse aleatoriamente alrededor de 0". Se interpreta fácilmente que si hay un patrón, usted ha violado los supuestos del modelo. Este no es el caso.

Colin