Una regresión de Poisson es un GLM con una función de enlace de registro.
Una forma alternativa de modelar datos de recuento no distribuidos normalmente es preprocesar tomando el registro (o mejor dicho, el registro (1 + recuento) para manejar los 0). Si realiza una regresión de mínimos cuadrados en las respuestas de recuento logarítmico, ¿está relacionado con una regresión de Poisson? ¿Puede manejar fenómenos similares?
regression
poisson-distribution
generalized-linear-model
Brendan OConnor
fuente
fuente
Respuestas:
Por un lado, en una regresión de Poisson, el lado izquierdo de la ecuación del modelo es el logaritmo de la cuenta esperada: .Iniciar sesión( E[ YEl | x])
Por otro lado, en un modelo lineal "estándar", el lado izquierdo es el valor esperado de la variable de respuesta normal: . En particular, la función de enlace es la función de identidad.mi[ YEl | x]
Ahora, digamos que es una variable de Poisson y que tiene la intención de normalizarla tomando el registro: . Debido a que se supone que es normal, planea ajustar el modelo lineal estándar para el que el lado izquierdo es . Pero, en general, . Como consecuencia, estos dos enfoques de modelado son diferentes.Y ′ = log ( Y ) Y ′ E [ Y ′ | x ] = E [ log ( Y ) | x ] E [ log ( Y ) | x ] ≠ log ( E [ Y | x ] )Y Y′= log( Y) Y′ mi[ Y′El | x]=E[ log( Y) | x ] mi[ log( Y) | x ] ≠ log( E[ YEl | x])
fuente
Veo dos diferencias importantes.
Primero, los valores predichos (en la escala original) se comportan de manera diferente; en mínimos cuadrados loglineales representan medias geométricas condicionales; en el modelo log-poisson, representan medios condicionales. Dado que los datos en este tipo de análisis a menudo están sesgados a la derecha, la media geométrica condicional subestimará la media condicional.
Una segunda diferencia es la distribución implícita: lognormal versus poisson. Esto se relaciona con la estructura de heterocedasticidad de los residuos: varianza residual proporcional a los valores esperados al cuadrado (lognormal) versus varianza residual proporcional al valor esperado (Poisson).
fuente
Una diferencia obvia es que la regresión de Poisson producirá enteros como predicciones puntuales, mientras que la regresión lineal de recuento logarítmico puede producir no enteros.
fuente