Este documento utiliza modelos lineales generalizados (distribuciones binomiales y de errores binomiales negativos) para analizar los datos. Pero luego, en la sección de análisis estadístico de los métodos, está esta declaración:
... y en segundo lugar modelando los datos de presencia utilizando Modelos de regresión logística y los datos de tiempo de búsqueda utilizando un Modelo lineal generalizado (GLM). Se usó una distribución binomial negativa con una función de enlace logarítmico para modelar los datos del tiempo de alimentación (Welsh et al. 1996) y la adecuación del modelo se verificó mediante el examen de los residuos (McCullagh y Nelder 1989). Las pruebas de Shapiro-Wilk o Kolmogorov-Smirnov se usaron para evaluar la normalidad dependiendo del tamaño de la muestra; los datos se transformaron logarítmicamente antes de los análisis para cumplir con la normalidad.
Si asumen distribuciones binomiales y de errores binomiales negativos, ¿entonces seguramente no deberían verificar la normalidad de los residuos?
Respuestas:
Nota: no se espera que los residuos de desviación (o Pearson) tengan una distribución normal, excepto en un modelo gaussiano. Para el caso de regresión logística, como dice @Stat, los residuos de desviación para la ésima observación están dados poryo yyo
si &yyo= 0
si , donde es la probabilidad ajustada de Bernoulli. Como cada uno puede tomar solo uno de dos valores, está claro que su distribución no puede ser normal, incluso para un modelo especificado correctamente:yyo= 1 πyo^
Pero si hay réplicas de observaciones para el ésimo patrón predictor, y la desviación residual se define para reunirlasni i
(donde es ahora el recuento de éxitos de 0 a ) y luego, a medida que la distribución de los residuos se aproxima más a la normalidad:n i n iyi ni ni
Las cosas son similares para Poisson o GLM binomiales negativos: para recuentos bajos pronosticados, la distribución de residuos es discreta y sesgada, pero tiende a la normalidad para recuentos más grandes bajo un modelo especificado correctamente.
No es habitual, al menos no en mi cuello del bosque, realizar una prueba formal de normalidad residual; Si las pruebas de normalidad son esencialmente inútiles cuando su modelo asume la normalidad exacta, entonces, a priori , es inútil cuando no lo hace. Sin embargo, para los modelos insaturados, los diagnósticos gráficos residuales son útiles para evaluar la presencia y la naturaleza de la falta de ajuste, tomando la normalidad con una pizca o un puñado de sal dependiendo del número de repeticiones por patrón predictor.
fuente
Lo que hicieron es correcto! Le daré una referencia para verificar dos veces. Consulte la Sección 13.4.4 en Introducción al análisis de regresión lineal, 5a ediciónpor Douglas C. Montgomery, Elizabeth A. Peck, G. Geoffrey Vining. En particular, mire los ejemplos en la página 460, donde se ajustan a una película binomial y verifique dos veces la suposición de normalidad de los "Residuos de desviación". Como se menciona en la página 458, esto se debe a que "los residuos de desviación se comportan de manera muy similar a los residuos ordinarios en un modelo estándar de regresión lineal de teoría normal". Por lo tanto, tiene sentido si los traza en una escala de trama de probabilidad normal, así como en valores ajustados. Nuevamente, vea la página 456 de la referencia anterior. En los ejemplos que han proporcionado en la página 460 y 461, no solo para el caso binomial, sino también para el Poisson glm y el Gamma con (link = log), han verificado la normalidad de los residuos de desviación.
Para el caso binomial, la desviación residual se define como:yi=0r D i = √
Verifique aquí también el caso de Poisson.
fuente