Quiero realizar una regresión logística con la siguiente respuesta binomial y con y como mis predictores.
Puedo presentar los mismos datos que las respuestas de Bernoulli en el siguiente formato.
Las salidas de regresión logística para estos 2 conjuntos de datos son en su mayoría las mismas. Los residuos de desviación y AIC son diferentes. (La diferencia entre la desviación nula y la desviación residual es la misma en ambos casos: 0.228).
Los siguientes son los resultados de regresión de R. Los conjuntos de datos se denominan binom.data y bern.data.
Aquí está la salida binomial.
Call:
glm(formula = cbind(Successes, Trials - Successes) ~ X1 + X2,
family = binomial, data = binom.data)
Deviance Residuals:
[1] 0 0 0
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.9649 21.6072 -0.137 0.891
X1Yes -0.1897 2.5290 -0.075 0.940
X2 0.3596 1.9094 0.188 0.851
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 2.2846e-01 on 2 degrees of freedom
Residual deviance: -4.9328e-32 on 0 degrees of freedom
AIC: 11.473
Number of Fisher Scoring iterations: 4
Aquí está la salida de Bernoulli.
Call:
glm(formula = Success ~ X1 + X2, family = binomial, data = bern.data)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.6651 -1.3537 0.7585 0.9281 1.0108
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.9649 21.6072 -0.137 0.891
X1Yes -0.1897 2.5290 -0.075 0.940
X2 0.3596 1.9094 0.188 0.851
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 15.276 on 11 degrees of freedom
Residual deviance: 15.048 on 9 degrees of freedom
AIC: 21.048
Number of Fisher Scoring iterations: 4
Mis preguntas:
1) Puedo ver que las estimaciones puntuales y los errores estándar entre los 2 enfoques son equivalentes en este caso particular. ¿Es esta equivalencia verdadera en general?
2) ¿Cómo puede justificarse matemáticamente la respuesta a la pregunta n. ° 1?
3) ¿Por qué los residuos de desviación y AIC son diferentes?
Solo quiero hacer comentarios sobre el último párrafo, “El hecho de que el AIC es diferente (pero el cambio en la desviación no lo es) vuelve al término constante que fue la diferencia entre las probabilidades de registro de los dos modelos. Al calcular el cambio en la desviación, esto se cancela porque es igual en todos los modelos basados en los mismos datos ". Desafortunadamente, esto no es correcto para el cambio en la desviación. La desviación no incluye el término constante Ex (constante adicional término en el log-verosimilitud para los datos binomiales). Por lo tanto, el cambio en la desviación no tiene nada que ver con el término constante EX. La desviación compara un modelo dado con el modelo completo. El hecho de que las desviaciones son diferentes de Bernoulli / binary y el modelado binomial pero el cambio en la desviación no se debe a la diferencia en los valores de probabilidad de registro del modelo completo. Estos valores se cancelan al calcular los cambios de desviación. Por lo tanto, los modelos de regresión logística de Bernoulli y binomial producen cambios de desviación idénticos siempre que las probabilidades predichas pij y pi sean las mismas. De hecho, eso es cierto para el probit y otras funciones de enlace.
Supongamos que lBm y lBf denotan los valores de probabilidad logarítmica del modelo de ajuste my modelo completo f a los datos de Bernoulli. La desviación es entonces
Aunque el lBf es cero para los datos binarios, no hemos simplificado el DB y lo hemos mantenido como está. La desviación del modelado binomial con las mismas covariables es
donde lbf + Ex y lbm + Ex son los valores de probabilidad de registro de los modelos full ym ajustados a los datos binomiales. El término constante adicional (Ex) desaparece del lado derecho de la Db. Ahora observe el cambio en las desviaciones del Modelo 1 al Modelo 2. Del modelado de Bernoulli, tenemos un cambio en la desviación de
Del mismo modo, el cambio en la desviación del ajuste binomial es
Se deduce de inmediato que los cambios de desviación están libres de las contribuciones de probabilidad logarítmica de los modelos completos, lbF y lbf. Por lo tanto, obtendremos el mismo cambio en la desviación, DBC = DbC, si lBm1 = lbm1 y lBm2 = lbm2. Sabemos que ese es el caso aquí y por eso estamos recibiendo los mismos cambios de desviación de Bernoulli y el modelado binomial. La diferencia entre lbf y lBf conduce a las diferentes desviaciones.
fuente