Tengo el siguiente resultado de ejecutar la función glm.
¿Cómo puedo interpretar los siguientes valores:
- Desviación nula
- Desviación residual
- AIC
¿Tienen algo que ver con la bondad del ajuste? ¿Puedo calcular alguna medida de bondad de ajuste a partir de estos resultados, como R-cuadrado o cualquier otra medida?
Call:
glm(formula = tmpData$Y ~ tmpData$X1 + tmpData$X2 + tmpData$X3 +
as.numeric(tmpData$X4) + tmpData$X5 + tmpData$X6 + tmpData$X7)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.52628 -0.24781 -0.02916 0.25581 0.48509
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept -1.305e-01 1.391e-01 -0.938 0.3482
tmpData$X1 -9.999e-01 1.059e-03 -944.580 <2e-16 ***
tmpData$X2 -1.001e+00 1.104e-03 -906.787 <2e-16 ***
tmpData$X3 -5.500e-03 3.220e-03 -1.708 0.0877 .
tmpData$X4 -1.825e-05 2.716e-05 -0.672 0.5017
tmpData$X5 1.000e+00 5.904e-03 169.423 <2e-16 ***
tmpData$X6 1.002e+00 1.452e-03 690.211 <2e-16 ***
tmpData$X7 6.128e-04 3.035e-04 2.019 0.0436 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for gaussian family taken to be 0.08496843)
Null deviance: 109217.71 on 3006 degrees of freedom
Residual deviance: 254.82 on 2999 degrees of freedom
(4970 observations deleted due to missingness)
AIC: 1129.8
Number of Fisher Scoring iterations: 2
r
regression
generalized-linear-model
aprendiz
fuente
fuente
Respuestas:
glm
glm
Existe cierto debate sobre cómo se interpreta dicha medida en el LHS, pero solo cuando los modelos se apartan de la situación más simple de Gauss / OLS. Pero en los GLM donde la función de enlace puede no ser "identidad", como sucedió aquí, y el "error al cuadrado" puede no tener la misma interpretación clara, entonces el Criterio de información de Akaike también se informa porque parece ser más general. Hay varios otros contendientes en el sorteo GLM GOF sin un ganador claro.
fuente
Utilice la desviación nula y la desviación residual, específicamente:
Si lo piensa, está tratando de medir la relación entre la desviación de su modelo y la nula; cuánto mejor es su modelo (desviación residual) que solo la intercepción (desviación nula). Si esa proporción es pequeña, está 'explicando' la mayor parte de la desviación en el valor nulo; 1 menos que te da tu R-cuadrado.
En tu caso obtendrías .998.
Si solo llama al modelo lineal (lm) en lugar de glm, explícitamente le dará un R cuadrado en el resumen y podrá ver que es el mismo número.
fuente
Si está ejecutando un modelo logístico binario, también puede ejecutar la prueba de bondad de ajuste Hosmer Lemeshow en su modelo glm (). Usando la biblioteca ResourceSelection.
fuente
family = "binomial
. El ejemplo de OP es una regresión lineal.hoslem.test()