Modelo multinivel versus modelos separados para cada nivel

10

¿Cuáles son las ventajas y desventajas de ejecutar modelos separados versus modelos multinivel?

Más particularmente, suponga que un estudio examinó pacientes anidados dentro de las prácticas médicas anidadas dentro de los países. ¿Cuáles son las ventajas / desventajas de ejecutar modelos separados para cada país frente a un modelo anidado de tres niveles?

Peter Flom - Restablece a Monica
fuente
2
Técnicamente necesita un poco de unidades de nivel 3 si va a obtener estimaciones de parámetros imparciales en un modelo de 3 niveles (en términos generales, el tamaño de la muestra en cualquier modelo multinivel es particularmente importante en el nivel más alto), así que a menos que tenga una gran muestra aleatoria de países (50+ quizás), probablemente debería considerar ejecutar modelos separados de 2 niveles, o si tiene pocos países, podría considerar tratar al país como un predictor categórico de nivel 2 en un modelo de 2 niveles
Patrick Coulombe
Hola @gung Estaba fuera, los miraré ahora.
Peter Flom - Restablece a Monica

Respuestas:

6

La pregunta está fechada pero creo que es muy importante. La mejor respuesta que puedo obtener es del libro de Joop J Hox (2010) "Técnicas y aplicaciones de análisis multinivel, segunda edición".

Suponga datos jerárquicos de dos niveles con variables explicativas en el nivel más bajo y variables explicativas en el nivel más alto. Luego, en la página 55, escribe:pq

Un modelo de regresión de nivel único ordinario para los mismos datos estimaría solo la intersección, la varianza de un error y las pendientes de regresión p + q. La superioridad del modelo de regresión multinivel es clara si consideramos que los datos están agrupados en grupos. Si tenemos 100 grupos, estimar un modelo de regresión múltiple ordinario en cada grupo por separado requiere estimar 100 × (1 intersección de regresión + 1 varianza residual + p pendientes de regresión) más posibles interacciones con las variables de nivel de grupo q. La regresión multinivel reemplaza la estimación de 100 intersecciones mediante la estimación de una intersección promedio más su varianza residual entre grupos, suponiendo una distribución normal para estos residuos. Así, El análisis de regresión multinivel reemplaza la estimación de 100 intersecciones separadas mediante la estimación de dos parámetros (la media y la varianza de las intersecciones), más un supuesto de normalidad. La misma simplificación se utiliza para las pendientes de regresión. En lugar de estimar 100 pendientes para la variable explicativa del género del alumno, estimamos la pendiente promedio junto con su varianza entre los grupos, y suponemos que la distribución de las pendientes es normal. Sin embargo, incluso con un número modesto de variables explicativas, el análisis de regresión multinivel implica un modelo complicado. En general, no queremos estimar el modelo completo, primero porque es probable que esto nos lleve a problemas computacionales, sino también porque es muy difícil interpretar un modelo tan complejo.

Eso es para la descripción. Ahora las páginas 29-30 responderán su pregunta con mayor precisión.

Las intersecciones y pendientes previstas para las 100 clases no son idénticas a los valores que obtendríamos si realizáramos 100 análisis de regresión ordinarios separados en cada una de las 100 clases, utilizando técnicas estándar de mínimos cuadrados ordinarios (MCO). Si tuviéramos que comparar los resultados de 100 análisis de regresión OLS separados con los valores obtenidos de un análisis de regresión multinivel, encontraríamos que los resultados de los análisis separados son más variables. Esto se debe a que las estimaciones multinivel de los coeficientes de regresión de las 100 clases están ponderadas. Se denominan estimaciones empíricas de Bayes (EB) o contracción: un promedio ponderado de la estimación OLS específica en cada clase y el coeficiente de regresión general, estimado para todas las clases similares.

Como resultado, los coeficientes de regresión se reducen hacia el coeficiente medio para todo el conjunto de datos. El peso de contracción depende de la fiabilidad del coeficiente estimado. Los coeficientes que se estiman con una precisión pequeña se reducen más que los coeficientes estimados con mucha precisión. La precisión de la estimación depende de dos factores: el tamaño de la muestra del grupo y la distancia entre la estimación basada en el grupo y la estimación general. Las estimaciones para grupos pequeños son menos confiables y se reducen más que las estimaciones para grupos grandes. En igualdad de condiciones, las estimaciones que están muy lejos de la estimación general se suponen menos confiables y se reducen más que las estimaciones que están cerca del promedio general. El método estadístico utilizado se llama estimación empírica de Bayes. Debido a este efecto de contracción, los estimadores empíricos de Bayes están sesgados. Sin embargo, generalmente son más precisos, una propiedad que a menudo es más útil que ser imparcial (ver Kendall, 1959).

Espero que sea satisfactorio.

Meng Hu
fuente
2

Especificar un efecto aleatorio implica asumir que las medias de esos niveles son muestras de una distribución normal. Es mejor especificarlos como efectos fijos, también variables ficticias AKA si esta suposición no se ajusta a sus datos. De esta manera, usted controla la heterogeneidad grupal en la media (en ese nivel), pero NO permite la heterogeneidad en las respuestas a sus variables de nivel inferior.

Si espera heterogeneidad en respuesta a sus variables explicativas de nivel inferior, los modelos separados tienen sentido, a menos que desee ejecutar algún tipo de modelo de coeficiente aleatorio (que nuevamente implica el supuesto de que los coeficientes se distribuyen normalmente).

(Creo que hay métodos para efectos aleatorios no normales, pero nada tan utilizado o accesible como lme)

genérico_usuario
fuente
1

Ventaja: La capacidad de probar explícitamente las diferencias en los parámetros por grupo (es decir, las diferencias en la significación no significan diferencias significativas).

DL Dahly
fuente
2
Esta respuesta es demasiado corta. Más un comentario que una respuesta.
Eric Peterson