Tengo un modelo logístico GLM con 8 variables. Realicé una prueba de chi-cuadrado en R anova(glm.model,test='Chisq')
y 2 de las variables resultan ser predictivas cuando se ordenan en la parte superior de la prueba y no tanto cuando se ordenan en la parte inferior. El summary(glm.model)
sugiere que sus coeficientes son insignificantes (alto valor de p). En este caso parece que las variables no son significativas.
Quería preguntar cuál es una mejor prueba de significación de las variables: la significación del coeficiente en el resumen del modelo o la prueba de ji al cuadrado anova()
. Además, ¿cuándo es uno mejor que el otro?
Supongo que es una pregunta amplia, pero cualquier sugerencia sobre qué considerar será apreciada.
Respuestas:
Además de la respuesta de @ gung, intentaré proporcionar un ejemplo de lo
anova
que realmente prueba la función. Espero que esto le permita decidir qué pruebas son apropiadas para las hipótesis que le interesan probar.Supongamos que tiene un resultado y 3 variables predictoras: x 1 , x 2 y x 3 . Ahora, si tu modelo de regresión logística fuera . Cuando ejecuta , la función compara los siguientes modelos en orden secuencial:y X1 X2 X3
my.mod <- glm(y~x1+x2+x3, family="binomial")
anova(my.mod, test="Chisq")
glm(y~1, family="binomial")
vs.glm(y~x1, family="binomial")
glm(y~x1, family="binomial")
vs.glm(y~x1+x2, family="binomial")
glm(y~x1+x2, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
Por lo tanto, compara secuencialmente el modelo más pequeño con el siguiente modelo más complejo al agregar una variable en cada paso. Cada una de esas comparaciones se realiza mediante una prueba de razón de verosimilitud (prueba LR; ver el ejemplo a continuación). Que yo sepa, estas hipótesis rara vez son de interés, pero esto debe decidirlo usted.
Aquí hay un ejemplo en
R
:summary(my.mod)
x1
:glm(y~x2+x3, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
x2
:glm(y~x1+x3, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
x3
:glm(y~x1+x2, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
Entonces cada coeficiente contra el modelo completo que contiene todos los coeficientes. Las pruebas de Wald son una aproximación de la prueba de razón de probabilidad. También podríamos hacer las pruebas de razón de probabilidad (prueba LR). Aquí es cómo:
summary(my.mod)
rank
anova(my.mod, test="Chisq")
rank
anova(mod1.2, my.mod, test="Chisq")
rank
fuente
test="Chisq"
no estás ejecutando una prueba de razón de probabilidad, debes configurartest="LRT"
eso, ¿ ves ? Anova.glm .test="LRT"
ytest="Chisq"
son sinónimos (lo dice en la página que ha vinculado).test="LRT"
es mejor ya que está claro de inmediato que es una prueba de razón de probabilidad. Lo cambie. Gracias.7.088e-05, 0.01419, 00.03684
deben interpretarse los valores p ( )?