He hojeado varios libros (Raudenbush y Bryk, Snijders y Bosker, Gelman y Hill, etc.) y varios artículos (Gelman, Jusko, Primo y Jacobsmeier, etc.), y todavía no he entendido todo. Las principales diferencias entre el uso de errores estándar agrupados versus el modelado multinivel.
Entiendo las partes que tienen que ver con la pregunta de investigación en cuestión; Existen ciertos tipos de respuestas que solo puede obtener del modelado multinivel. Sin embargo, por ejemplo, para un modelo de dos niveles donde sus coeficientes de interés están solo en el segundo nivel, ¿cuál es la ventaja de hacer un método sobre el otro? En este caso, no me preocupa hacer predicciones o extraer coeficientes individuales para grupos.
La principal diferencia que he podido encontrar es que los errores estándar agrupados sufren cuando los grupos tienen tamaños de muestra desiguales y que el modelado multinivel es débil porque supone una especificación de la distribución de coeficientes aleatorios (mientras que el uso de errores estándar agrupados no tiene modelos) .
Y al final, ¿significa todo esto que para los modelos que aparentemente podrían usar cualquiera de los métodos, deberíamos obtener resultados similares en términos de coeficientes y errores estándar?
Cualquier respuesta o recursos útiles serán muy apreciados.
Respuestas:
Esta publicación se basa en experiencias personales que pueden ser específicas de mis datos, por lo que no estoy seguro de que califique como respuesta.
Sugiero utilizar simulaciones si es posible para evaluar qué método funciona mejor para sus datos. Hice esto y me sorprendió descubrir que las pruebas (con respecto a los parámetros en el primer nivel) basadas en el modelado multinivel superaron a cualquier otro método (en términos de potencia), al tiempo que conservaron el tamaño incluso en muestras pequeñas con pocos "grupos" de tamaños desiguales. Todavía tengo que encontrar un documento que haga ese punto, y por lo que veo, este no es realmente un tema de nicho y merece más atención. Creo que está bastante poco investigado cómo los diferentes métodos se comparan con muestras finitas o con pocos / desiguales grupos.
fuente