¿Un Poisson truncado cero y un Poisson básico están anidados o no anidados?

He visto muchas cosas que discuten si una regresión de Poisson básica es una versión anidada de una regresión de Poisson inflada a cero. Por ejemplo, este sitio argumenta que lo es, ya que este último incluye parámetros adicionales para modelar ceros adicionales, pero por lo demás incluye los mismos parámetros de regresión de Poisson que el primero, aunque la página incluye una referencia que no está de acuerdo.

Lo que no puedo encontrar información es si un Poisson truncado cero y un Poisson básico están anidados. Si el Poisson truncado a cero es solo un Poisson con la estipulación adicional de que la probabilidad de un conteo cero es cero, entonces creo que parece que podría ser, pero esperaba una respuesta más definitiva.

La razón por la que me pregunto es que afectará si debo usar la prueba de Vuong (para modelos no anidados), o una prueba de chi-cuadrado más básica basada en la diferencia en las verosimilitudes (para modelos anidados).

Wilson (2015) habla sobre si una prueba de Vuong es apropiada para comparar la regresión inflada a cero con la básica, pero no puedo encontrar una fuente que discuta los datos truncados a cero.

poisson-regression zero-inflation Justin
fuente

Respuestas:

Solo encuentra esto ahora. Para evitar confusiones, soy el Wilson de Wilson (2015) al que se hace referencia en la pregunta original, que pregunta si los modelos de Poisson y de Poisson truncados están anidados, no anidados, etc. Simplificando ligeramente, un modelo más pequeño está anidado en un modelo más grande si el más grande el modelo se reduce al más pequeño si un subconjunto de sus parámetros se fija en los valores establecidos; dos modelos se superponen si ambos se reducen al mismo modelo cuando los subconjuntos de sus respectivos parámetros están fijados a ciertos valores, no están anidados si no importa cómo se fijan los parámetros, uno no puede reducirse al otro. Según esta definición, el Poisson truncado y el Poisson estándar no están anidados. SIN EMBARGO, y este es un punto que parece haber sido pasado por alto por muchos, la teoría de distribución de Vuong se refiere a ESTRICTAMENTE anidado, ESTRICTAMENTE no anidado, y estrictamente superpuestos. "ESTRICTAMENTE" refiriéndose a la adición de seis restricciones a la definición básica de anidado, etc. Estas restricciones no son exactamente simples, pero significan, entre otras cosas, que los resultados de Vuong sobre la distribución de las razones de probabilidad logarítmica no son aplicables en casos donde los modelos / distribuciones se anidan en un límite de un espacio de parámetros (como es el caso de Poisson / Poisson inflado con cero con un enlace de identidad para el parámetro de inflación cero) o cuando un modelo tiende al otro cuando un parámetro tiende al infinito, como es el caso con el Poisson / Poisson con inflación cero cuando se usa un enlace logit para modelar el parámetro de inflación cero. Vuong no avanza ninguna teoría sobre la distribución de las razones de probabilidad logarítmica en estas circunstancias. Lamentablemente aquí

El siguiente código R simulará la distribución de las relaciones de loglikelihood de Poisson y de Poisson truncada. Requiere el VGAMpaquete.

n<-30   
lambda1<-1
H<-rep(999,10000)
for(i in 1:10000){
  print(i)
  y<-rpospois(n, lambda1)
  fit1 <- vglm(y ~ 1, pospoisson)
  fit2<-glm(y~1, family=poisson(link="log"))
  H[i]<-logLik(fit1)-logLik(fit2)
}

hist(H,col="lemonchiffon")

Pauljw11
fuente

El Poisson básico puede considerarse anidado dentro de una forma más general:

$p(x) = (1-p)\frac{\text{e}^{-\lambda}\lambda^x}{x!} + p1(x=0)$

Cuando , tenemos el Poisson básico. Cuando , tenemos el Poisson truncado a cero. Cuando , tenemos un Poisson reducido a cero. Cuando , tenemos un Poisson inflado a cero, y tenemos una distribución degenerada en . $p = 0$ $p = -\exp\{-\lambda\}/(1 -\exp\{-\lambda\})$ $-\exp\{-\lambda\}/(1 -\exp\{-\lambda\}) < p < 0$ $0 < p < 1$ $p = 1$

Entonces, me parece que la versión anidada de la prueba de Vuong, o el chi-cuadrado como usted sugiere, sería apropiada en su caso. Sin embargo, tenga en cuenta que el chi-cuadrado puede tener problemas debido a las pequeñas probabilidades de observaciones "grandes" (en relación con ). Probablemente quiera usar un bootstrap para obtener el valor p para la estadística de chi-cuadrado en lugar de confiar en los asintóticos a menos que tenga bastante información. $\lambda$

jbowman
fuente

Gracias @jbowman, esa es la clase de respuesta más rigurosa que esperaba. Sin embargo, no estoy claro: pensé que el objetivo de una prueba de Vuong era para modelos no anidados, por lo que, aunque va más allá de mi publicación original, ¿podría proporcionar un poco más de información sobre la "versión anidada de la prueba de Vuong". Para ser claro sobre el origen de mi confusión: hasta este momento solo estaba al tanto de la vuongfunción en el paquete psclen R que dice que es para modelos no anidados. Acabo de buscar en Google y encontré la función vuongtesten el paquete nonnest2que incluye un argumento 'anidado'. ¿Es asi?

Justin

Si eso es. En realidad, la página de Wikipedia en.wikipedia.org/wiki/Vuong%27s_closeness_test en la prueba de Vuong es ligeramente útil (a menudo no es tanto) para describir la diferencia.

jbowman

NB Tanto el Poisson como el Poisson truncado a cero son casos especiales de la distribución que ha definido. Uno no está anidado en el otro. Por lo tanto, no puede usar el teorema de Wilks para derivar una distribución asintótica de chi-cuadrado para el doble de la razón de probabilidad logarítmica, cualquiera que considere la hipótesis nula. (Creo que también hay algunas condiciones de regularidad para la prueba de Vuong.)

Scortchi - Restablece a Monica

@Scortchi Tengo curiosidad acerca de la definición de "anidado" que está aplicando. Aunque no estoy en desacuerdo con su conclusión, llego a ella desde un punto de vista ligeramente diferente: sí, el Poisson está anidado dentro de esta familia (porque surge al restringir a ) pero varias conclusiones sobre las distribuciones asintóticas de MLE Las estimaciones de parámetros para no se aplican porque este valor de encuentra en el límite de la familia. ¿Me estoy perdiendo alguna distinción importante?

p = 0

$p=0$

p

$p$

p

$p$

whuber

@whuber, iba a comentar / proporcionar una respuesta sobre el mismo punto. El enlace al que se hace referencia señala: "... aunque la distribución de chi-cuadrado puede necesitar algún ajuste porque la restricción está en el límite del espacio de parámetros"

Ben Bolker