Tengo una regresión logística de intercepción aleatoria (debido a mediciones repetidas) y me gustaría hacer algunos diagnósticos, específicamente en relación con valores atípicos y observaciones influyentes.
Miré los residuos para ver si hay observaciones que se destacan. Pero también me gustaría mirar algo como la distancia de Cook o DFFITS. Hosmer y Lemeshow (2000) dicen que debido a la falta de herramientas de diagnóstico del modelo para datos correlacionados, uno simplemente debería ajustarse a un modelo de regresión logística regular ignorando la correlación y usar las herramientas de diagnóstico disponibles para la regresión logística regular. Argumentan que esto sería mejor que no hacer ningún diagnóstico en absoluto.
El libro es de 2000 y me pregunto si hay métodos disponibles ahora para el diagnóstico de modelos con regresión logística de efectos mixtos. ¿Cuál sería un buen enfoque para buscar valores atípicos?
Editar (5 de noviembre de 2013):
Debido a la falta de respuestas, me pregunto si hacer diagnósticos con modelos mixtos no se hace en general o, más bien, no es un paso importante al modelar datos. Entonces déjenme reformular mi pregunta: ¿Qué hacen una vez que encuentran un "buen" modelo de regresión?
fuente
Respuestas:
Los métodos de diagnóstico son de hecho diferentes para los modelos lineales mixtos generalizados. Uno razonable que he visto que se basa en los residuos de un GLMM se debe a Pan y Lin (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x) Han estado utilizando sumas acumulativas de residuos donde el ordenamiento es impuesto por las variables explicativas o por el predictor lineal, probando así la especificación de la forma funcional de un predictor dado o la función de enlace en su conjunto. Las distribuciones nulas se basan en simulaciones del espacio de diseño a partir de la distribución nula de especificaciones correctas, y demostraron propiedades de tamaño y potencia decentes de esta prueba. No discutieron los valores atípicos específicamente, pero me imagino que los valores atípicos probablemente deberían descartar al menos la función de enlace curvándola demasiado hacia la observación influyente.
fuente
Hay muchas opiniones diferentes sobre cuál es la mejor manera de ver los diagnósticos para modelos mixtos. En general, querrá observar tanto los aspectos residuales como los aspectos estándar que se examinarían para un modelo de medidas no repetidas.
Además de esos, por lo general, también querrá observar los efectos aleatorios. Los métodos a menudo implican trazar los efectos aleatorios por varias covariables y buscar la no normalidad en la distribución de efectos aleatorios. Hay muchos más métodos (algunos mencionados en los comentarios anteriores), pero este suele ser un buen comienzo.
fuente