Estoy usando R y he estado analizando mis datos con GLM con el enlace Binomial.
Quiero saber cuál es el significado de la intercepción en la tabla de salida. La intercepción de uno de mis modelos es significativamente diferente, sin embargo, la variable no lo es. ¿Qué significa esto?
¿Qué es la intercepción? No sé si me estoy confundiendo a mí mismo, pero después de haber buscado en Internet, no hay nada más que decir, es esto, date cuenta ... o no.
Por favor ayuda, un estudiante muy frustrado
glm(formula = attacked_excluding_app ~ treatment, family = binomial,
data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3548 0.3593 0.3593 0.3593 0.3593
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.708 1.033 2.622 0.00874 **
treatmentshiny_non-shiny 0.000 1.461 0.000 1.00000
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963 on 31 degrees of freedom
Residual deviance: 14.963 on 30 degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5
r
generalized-linear-model
Samuel Waldron
fuente
fuente
Respuestas:
El término de intersección es la intersección en la parte lineal de la ecuación GLM, por lo que su modelo para la media es , donde g es su función de enlace y X β es su modelo lineal. Este modelo lineal contiene un "término de intercepción", es decir:mi[ Y] = g- 1( X β) sol X β
En su caso, la intersección es significativamente distinta de cero, pero la variable no lo es, por lo que está diciendo que
Debido a que su función de enlace es binomial, entonces
Y así, con solo el término de intercepción, su modelo ajustado para la media es:
Puede ver que si , esto corresponde simplemente a una probabilidad de 50:50 de obtener Y = 1 o 0, es decir, E [ Y ] = 1c = 0 mi[ Y] = 11 + 1= 0.5
Por lo tanto, su resultado dice que no puede predecir el resultado, pero una clase (1 o 0) es más probable que la otra.
fuente
Me parece que puede haber algún problema con los datos. Es extraño que la estimación del parámetro para el coeficiente sea 0.000. Parece que tanto su DV como su IV son dicotómicos y que las proporciones de su DV no varían en absoluto con su IV. ¿Es esto correcto?
La intersección, como señalé en mi comentario (y como implica la respuesta de @corone) es el valor del DV cuando el IV es 0. ¿Cómo se codificó su IV? Como es, sin embargo, el hecho de que la estimación del coeficiente sea 0.000 implica que el IV no hace ninguna diferencia.
fuente
En su caso, la intersección es la gran media de
attacked_excluding_app
, calculada para todos los datos independientemente detreatment
. La prueba de significancia en la tabla de coeficientes está probando si es significativamente diferente de cero. Si esto es relevante depende de si tiene alguna razón a priori para esperar que sea cero o no.Por ejemplo, imagina que has probado un medicamento y un placebo por su efecto sobre la presión arterial. Para cada sujeto, registra el cambio en su presión arterial calculando (presión después del tratamiento - presión antes del tratamiento) y trata esto como la variable dependiente en su análisis. Luego descubre que el efecto del tratamiento (fármaco versus placebo) no es significativo, pero que la intercepción es significativamente> 0; esto le indicaría que, en promedio, la presión arterial de sus sujetos aumentó entre los dos tiempos de medición. Esto puede ser interesante y necesita más investigación.
fuente