Supongamos que son independientes yY=(Y1,…,Yn)′
Yyo= 0Yyo= kwith probability pi+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!
Supongamos también que los parámetros y satisfacenλ=(λ1,…,λn)′p=(p1,…,pn)
log(λ)logit(p)=Bβ=log(p/(1−p))=Gλ.
Si las mismas covariables afectan a λ y p modo que B=G , entonces ¿por qué la regresión de Poisson inflada a cero requiere el doble de parámetros que la regresión de Poisson?
Respuestas:
En el caso de Poisson inflado cero, si , a continuación, β y λ ambos tienen la misma longitud, que es el número de columnas de B o G . Por lo tanto, el número de parámetros es el doble del número de columnas de la matriz de diseño, es decir, el doble del número de variables explicativas, incluida la intercepción (y cualquier codificación ficticia necesaria).B=G β λ B G
En una regresión directa de Poisson, no hay un vector que preocuparse, no es necesario estimar λ . Entonces, el número de parámetros es solo la longitud de β, es decir, la mitad del número de parámetros en el caso inflado a cero.p λ β
Ahora, no hay una razón particular por la que tenga que ser igual a G , pero generalmente tiene sentido. Sin embargo, uno podría imaginar un proceso de generación de datos donde la posibilidad de tener algún evento sea creada por un proceso G λ y un proceso completamente diferente B β impulsa cuántos eventos hay, dados los eventos distintos de cero. Como ejemplo artificial, elijo las aulas en función de sus puntajes en el examen de Historia para jugar algún juego no relacionado, y luego observo la cantidad de goles que marcan. En este caso, B podría ser bastante diferente a G (si las cosas que conducen los puntajes del examen de Historia son diferentes a las que conducen el rendimiento del juego) y β y λB G Gλ Bβ B G β λ podría tener diferentes longitudes. podría tener más columnas que B o menos. Entonces, el modelo de Poisson inflado a cero en ese caso tendrá más parámetros que un modelo de Poisson simple.G B
En la práctica común, creo que mayor parte del tiempo.G=B
fuente