Esta es mi primera publicación. Estoy realmente agradecido por esta comunidad.
Estoy tratando de analizar datos de recuento longitudinal truncados a cero (probabilidad de que la variable de respuesta = 0 sea 0), y la media! = Varianza, por lo que se eligió una distribución binomial negativa sobre un poisson.
Funciones / comandos que he descartado:
R
- La función gee () en R no tiene en cuenta el truncamiento cero ni la distribución binomial negativa (ni siquiera con el paquete MASS cargado)
- glm.nb () en R no permite diferentes estructuras de correlación
- vglm () del paquete VGAM puede hacer uso de la familia posnegbinomial, pero tiene el mismo problema que el comando ztnb de Stata (ver más abajo) en que no puedo reajustar los modelos usando una estructura de correlación no independiente.
Stata
- Si los datos no fueran longitudinales, podría usar los paquetes Stata ztnb para ejecutar mi análisis, PERO ese comando supone que mis observaciones son independientes.
También he descartado GLMM por varias razones metodológicas / filosóficas.
Por ahora, me he decidido por el comando xtgee de Stata (sí, sé que xtnbreg también hace lo mismo) que tiene en cuenta tanto las estructuras de correlación no independientes como la familia binomial neg, pero no el truncamiento cero. El beneficio adicional de usar xtgee es que también puedo calcular valores qic (usando el comando qic) para determinar las estructuras de correlación de mejor ajuste para mis variables de respuesta.
Si hay un paquete / comando en R o Stata que puede tener en cuenta 1) familia nbinomial, 2) GEE y 3) truncamiento cero, me moriría por saberlo.
Agradecería mucho cualquier idea que pueda tener. Gracias.
-Casey
fuente
gamlss
paquete que también podría ajustarse a la factura en R.Hmm, buena primera pregunta! No conozco un paquete que cumpla con sus requisitos precisos. Creo que el xtgee de Stata es una buena opción si también especificas la
vce(robust)
opción de dar los errores estándar de Huber-White, ovce(bootstrap)
si eso es práctico. Cualquiera de estas opciones asegurará que los errores estándar se estimen de manera consistente a pesar de la especificación errónea del modelo que tendrá al ignorar el truncamiento cero.Eso deja la pregunta de qué efecto tendrá en ignorar el truncamiento cero en las estimaciones puntuales que le interesan. Vale la pena realizar una búsqueda rápida para ver si hay literatura relevante sobre esto en general, es decir, no necesariamente en un contexto GEE; habría pensado que puede asumir con bastante seguridad que tales resultados también serán relevantes en el caso GEE. Si no puede encontrar nada, siempre puede simular datos con truncamiento cero y estimados de efectos conocidos y evaluar el sesgo mediante simulación.
fuente
Tuve el mismo problema en mi disertación. En Stata, acabo de construir un programa .ado personalizado con dos llamadas a xtgee.
Para esto, encontré que las diapositivas / programas "Modelado de costos y cuentas de atención médica" de Partha Deb, Willard Manning y Edward Norton son útiles. No hablan de datos longitudinales, pero es un punto de partida útil.
fuente
Estaba buscando respuestas sobre la interpretación de glmmADMB y vi tu publicación. Sé que fue hace mucho tiempo, pero podría tener la respuesta.
Mire el paquete glmmADMB cuando use modelos de obstáculo. Debe dividir en dos los análisis de sus datos: uno de ellos trata solo los datos que no son cero. Puede agregar efectos mixtos y elegir la distribución. ¡La condición es que los datos deben estar inflados a cero y no sé si esto cumplió con sus requisitos! De todos modos, ¡espero que lo hayas descubierto hace mucho tiempo!
fuente