Evaluación de modelos de regresión logística.

13

Esta pregunta surge de mi confusión real sobre cómo decidir si un modelo logístico es lo suficientemente bueno. Tengo modelos que usan el estado de pares proyecto individual dos años después de que se forman como una variable dependiente. El resultado es exitoso (1) o no (0). Tengo variables independientes medidas en el momento de la formación de los pares. Mi objetivo es probar si una variable, que supuse que influiría en el éxito de los pares, tiene un efecto sobre ese éxito, controlando otras posibles influencias. En los modelos, la variable de interés es significativa.

Los modelos se estimaron utilizando la glm()función en R. Para evaluar la calidad de los modelos, he hecho algunas cosas: glm()le da el residual deviance, el AICy el BICpor defecto. Además, calculé la tasa de error del modelo y tracé los residuos agrupados.

  • El modelo completo tiene una desviación residual, AIC y BIC más pequeña que los otros modelos que he estimado (y que están anidados en el modelo completo), lo que me lleva a pensar que este modelo es "mejor" que los otros.
  • La tasa de error del modelo es bastante baja, en mi humilde opinión (como en Gelman y Hill, 2007, pp.99 ):
    error.rate <- mean((predicted>0.5 & y==0) | (predicted<0.5 & y==1)alrededor del 20%.

Hasta aquí todo bien. Pero cuando trazo el residuo binned (nuevamente siguiendo el consejo de Gelman y Hill), una gran parte de los contenedores quedan fuera del IC del 95%: Trama de residuos agrupados

Esa trama me lleva a pensar que hay algo completamente incorrecto en el modelo. ¿Debería eso llevarme a tirar la modelo? ¿Debo reconocer que el modelo es imperfecto pero mantenerlo e interpretar el efecto de la variable de interés? He jugado con variables excluyentes a su vez, y también alguna transformación, sin mejorar realmente el gráfico de residuos agrupados.

Editar:

  • Por el momento, el modelo tiene una docena de predictores y 5 efectos de interacción.
  • Las parejas son "relativamente" independientes entre sí en el sentido de que todas se forman durante un corto período de tiempo (pero no hablando estrictamente, todo simultáneamente) y hay muchos proyectos (13k) y muchas personas (19k ), por lo que una proporción justa de proyectos solo se unen por un individuo (hay alrededor de 20000 pares).
Antoine Vernet
fuente
2
Y
1
Según lo que dices, el tamaño de la muestra no parece ser un problema, porque tengo alrededor de 20000 mil pares (de los cuales aproximadamente el 20% tienen éxito).
Antoine Vernet

Respuestas:

11

La precisión de clasificación (tasa de error) es una regla de puntuación incorrecta (optimizada por un modelo falso), arbitraria, discontinua y fácil de manipular. No es necesario en este contexto.

No mencionaste cuántos predictores había. En lugar de evaluar el ajuste del modelo, estaría tentado a hacer que el modelo se ajuste. Un enfoque de compromiso es asumir que las interacciones no son importantes y permitir que los predictores continuos sean no lineales utilizando splines de regresión. Trazar las relaciones estimadas. El rmspaquete en R hace que todo esto sea relativamente fácil. Ver http://biostat.mc.vanderbilt.edu/rms para más información.

Puede elaborar sobre "pares" y si sus observaciones son independientes.

Frank Harrell
fuente
Si entiendo correctamente, su consejo es concentrarse en la gráfica de los residuos y aclarar esto antes de hacer cualquier otra cosa, eventualmente usando splines de regresión, ¿estoy en lo correcto? Edité la pregunta para indicar cuántos predictores hay y que los pares son "relativamente" independientes.
Antoine Vernet
Hola @ Frank. ¿Por qué dice que la precisión de clasificación es un mal método? ¿Es porque aquí se evalúa con los mismos datos de donde se deriva el modelo?
Peter Flom - Restablece a Monica
2
χ2C
2
No, me refiero a permitir que los predictores continuos funcionen de forma no lineal en la escala de probabilidades de registro, expandiéndolos en términos múltiples utilizando splines cúbicas restringidas (splines naturales). Luego, trace las transformaciones estimadas para conocer los efectos parciales de cada predictor.
Frank Harrell el
1
Gracias por el aporte, fue realmente útil. Al profundizar más en los datos, me di cuenta de que tenía problemas de colinealidad (incluso si no tenía altas correlaciones por pares).
Antoine Vernet
4

X2

gung - Restablece a Monica
fuente