Faltan valores en la variable de respuesta en JAGS

10

Gelman y Hill (2006) dicen:

En Bugs, los resultados faltantes en una regresión se pueden manejar fácilmente simplemente incluyendo el vector de datos, NA y todo. Los errores modelan explícitamente la variable de resultado, por lo que es trivial usar este modelo para, en efecto, imputar valores faltantes en cada iteración.

Esto suena como una manera fácil de usar JAGS para hacer predicciones. Pero, ¿las observaciones con los resultados faltantes también afectan las estimaciones de los parámetros? Si es así, ¿hay una manera fácil de mantener estas observaciones en el conjunto de datos que ve JAGS, pero no hacer que afecten las estimaciones de los parámetros? Estaba pensando en la función de corte, pero solo está disponible en BUGS, no en JAGS.

Jack Tanner
fuente

Respuestas:

11

Sí, es realmente fácil de usar en BUGS o JAGS. ¡Es realmente un placer usarlo!

Pero, ¿las observaciones con los resultados faltantes también afectan las estimaciones de los parámetros?

Por supuesto no. Los parámetros solo se ven afectados por los resultados observados. Los resultados faltantes (NA) no afectarán nada, en realidad es al revés: los resultados faltantes se derivarán de los parámetros. Tenga en cuenta que los resultados faltantes también tendrán su distribución posterior. Entonces es muy fácil calcular algunas cantidades derivadas, por ejemplo, como una suma sobre los índices del resultado, y estas cantidades derivadas no solo se manejan para valores perdidos, sino que también tienen su distribución posterior de manera inmediata. ¡Eso es lo que es tan sexy en BUGS & JAGS!

¡Que te diviertas!

Curioso
fuente
1
Lo sentimos, no estoy convencido de que los resultados faltantes no afecten las estimaciones de los parámetros. Jackman parece decir lo contrario: jackman.stanford.edu/blog/?p=38
Jack Tanner
@JackTanner, piénsalo un momento. ¿Cómo puede afectar algo el valor perdido? Cuando comienza el algoritmo, el valor faltante comenzará a imputarse a partir de las estimaciones de los parámetros (estos se derivan de los resultados observados). Entonces (tal vez, no estoy seguro), la información del resultado faltante imputado puede volver a los parámetros, pero no importa: es solo la información original, presente en los parámetros, devuelta a ellos. La información REAL que afecta algo proviene únicamente de los resultados REALES. Si no confías en mí, haz una simulación, compara los resultados y publica aquí.
Curioso
Con respecto a su enlace, aparentemente no está seguro al respecto, dice "problema" - entre comillas, y dice "sería interesante compararlo". Yo digo que no habrá una diferencia significativa. Si quieres probarlo, adelante.
Curioso
3
Estoy de acuerdo; No hay diferencia significativa. Utilizo este enfoque para construir distribuciones predictivas posteriores; simplemente ponga los valores predictivos de las variables del lado derecho junto con los valores pasados, y los NA para las "observaciones" de la variable objetivo correspondientes a los valores predictivos.
jbowman
@jbowman, sí, ¡buena nota! ¡No es una idea obvia hacer predicciones de esta manera!
Curioso