Si hay 0 en la tabla de contingencia y estamos ajustando modelos poisson / loglineales anidados (usando la glm
función de R ) para una prueba de razón de probabilidad, ¿necesitamos ajustar los datos antes de ajustar los modelos glm (por ejemplo, agregar 1/2 a todos los recuentos)? Obviamente, algunos parámetros no pueden estimarse sin algún ajuste, pero ¿cómo afecta el ajuste / falta de ajuste a la prueba LR?
9
glm
rutina se volvería loca si no pudiera manejar los ceros. ¿Lo has probado?Respuestas:
Uno de los poderes del modelado de regresión en general es que puedes suavizar áreas sin datos, aunque, como has notado, ocasionalmente hay problemas para estimar los parámetros. Sugeriría que si obtiene cosas como errores estándar infinitos, es hora de reconsiderar su enfoque de modelado al poco.
Una nota particular de precaución: hay una diferencia entre "No contar" en un estrato particular, y es imposible que haya conteos en ese estrato. Por ejemplo, imagine que está trabajando en un estudio de trastornos psicológicos para la Marina de los EE. UU. Entre 2000 y 2009, y tiene términos de regresión binaria para "Es una mujer" y "Sirve en un submarino". Un modelo de regresión puede estimar los efectos donde ambas variables = 1 a pesar de tener un conteo cero donde ambas = 1. Sin embargo, esa inferencia no sería válida, tal circunstancia es imposible. Este problema se llama "no positividad" y ocasionalmente es un problema en modelos altamente estratificados.
fuente