¿En qué condiciones debería alguien considerar el uso de análisis multinivel / jerárquico en lugar de análisis más básicos / tradicionales (por ejemplo, ANOVA, regresión OLS, etc.)? ¿Hay alguna situación en la que esto pueda considerarse obligatorio? ¿Hay situaciones en las que el uso de análisis multinivel / jerárquico es inapropiado? Finalmente, ¿cuáles son algunos buenos recursos para que los principiantes aprendan análisis multinivel / jerárquico?
mixed-model
multilevel-analysis
Patricio
fuente
fuente
Respuestas:
Cuando la estructura de sus datos es naturalmente jerárquica o anidada, el modelado multinivel es un buen candidato. De manera más general, es un método para modelar interacciones.
Un ejemplo natural es cuando sus datos provienen de una estructura organizada, como el país, el estado, los distritos, donde desea examinar los efectos en esos niveles. Otro ejemplo en el que puede ajustarse a dicha estructura es el análisis longitudinal, en el que tiene mediciones repetidas de muchos sujetos a lo largo del tiempo (por ejemplo, alguna respuesta biológica a una dosis de fármaco). Un nivel de su modelo supone una respuesta media grupal para todos los sujetos a lo largo del tiempo. Otro nivel de su modelo permite perturbaciones (efectos aleatorios) de la media grupal para modelar las diferencias individuales.
Un libro popular y bueno para comenzar es el Análisis de datos de Gelman usando regresión y modelos multinivel / jerárquicos .
fuente
El Centro para el modelado multinivel tiene algunos buenos tutoriales gratuitos en línea para el modelado multinivel, y tienen tutoriales de software para ajustar modelos tanto en su software MLwiN como en STATA.
Tome esto como herejía, porque no he leído más que un capítulo en el libro, sino modelos lineales jerárquicos: aplicaciones y métodos de análisis de datos Por Stephen W. Raudenbush, Anthony S. Bryk es muy recomendable. ¡También juré que había un libro sobre modelado de niveles múltiples usando el software R en Springer Use R! serie, pero parece que no puedo encontrarla en este momento (pensé que fue escrita por las mismas personas que escribieron el libro A Beginner's Guide to R).
editar: El libro sobre el uso de R para modelos multinivel es Modelos de efectos mixtos y extensiones en ecología con R de Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM
buena suerte
fuente
Aquí hay otra perspectiva sobre el uso de modelos multinivel vs. regresión: en un interesante artículo de Afshartous y de Leeuw, muestran que si el propósito del modelado es predictivo (es decir, predecir nuevas observaciones), la elección del modelo es diferente de cuando El objetivo es la inferencia (donde intenta hacer coincidir el modelo con la estructura de datos). El documento al que me refiero es
Afshartous, D., de Leeuw, J. (2005). Predicción en modelos multinivel. J. Educat. Behav Estadístico. 30 (2): 109-139.
Acabo de encontrar otro artículo relacionado de estos autores aquí: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf
fuente
Con el modelo en mano, el problema se convierte en una cuestión de estimación. Si tiene muchas escuelas y muchos datos para cada escuela, las buenas propiedades de OLS (vea Angrist y Pischke, Mayormente inofensivo ..., para una revisión actual) sugiera que desearía usar eso, con ajustes adecuados a los errores estándar para tener en cuenta las dependencias, y el uso de variables ficticias e interacciones para obtener efectos a nivel escolar e intercepciones específicas de la escuela. OLS puede ser ineficiente, pero es tan transparente que podría ser más fácil convencer a un público escéptico si lo usa. Pero si sus datos son escasos de ciertas maneras, particularmente si tiene pocas observaciones para algunas escuelas, es posible que desee imponer más "estructura" al problema. Es posible que desee "tomar prestada fortaleza" de las escuelas de muestra más grande para mejorar las estimaciones ruidosas que obtendría en las escuelas de muestra pequeña si la estimación se hiciera sin estructura. Luego, puede recurrir a un modelo de efectos aleatorios estimado a través de FGLS,
En este ejemplo, el uso de un modelo multinivel (sin embargo, en última instancia, decidimos ajustarlo) está motivado por el interés directo en las intercepciones a nivel escolar. Por supuesto, en otras situaciones, estos parámetros a nivel de grupo pueden no ser más que molestias. Si necesita o no ajustarlos (y, por lo tanto, seguir trabajando con algún tipo de modelo multinivel) depende de si se cumplen ciertos supuestos de exogeneidad condicional. Sobre eso, recomendaría consultar la literatura econométrica sobre métodos de datos de panel; La mayoría de las ideas a partir de ahí se transfieren a contextos de datos agrupados generales.
fuente
El modelado multinivel es apropiado, como su nombre lo indica, cuando sus datos tienen influencias que ocurren en diferentes niveles (individual, a lo largo del tiempo, sobre dominios, etc.). El modelado de nivel único supone que todo está ocurriendo en el nivel más bajo. Otra cosa que hace un modelo multinivel es introducir correlaciones entre unidades anidadas. Por lo tanto, las unidades de nivel 1 dentro de la misma unidad de nivel 2 estarán correlacionadas.
En cierto sentido, se puede pensar en el modelado multinivel como un punto intermedio entre la "falacia individualista" y la "falacia ecológica". La falacia individualista es cuando se ignoran los "efectos de la comunidad", como la compatibilidad del estilo de un maestro con el estilo de aprendizaje de un alumno, por ejemplo (se supone que el efecto proviene solo del individuo, así que solo haga la regresión en el nivel 1). mientras que "falacia ecológica" es lo opuesto, y sería como suponer que el mejor maestro tiene a los estudiantes con las mejores calificaciones (y para que el nivel 1 no sea necesario, simplemente haga la regresión por completo en el nivel 2). En la mayoría de los entornos, ninguno es apropiado (el alumno-maestro es un ejemplo "clásico").
fuente
En general, hablar de un análisis jerárquico bayesiano (HB) conducirá a estimaciones de nivel individual eficientes y estables a menos que sus datos sean tales que los efectos de nivel individual sean completamente homogéneos (un escenario poco realista). La eficiencia y las estimaciones de parámetros estables de los modelos HB se vuelven realmente importantes cuando tiene datos escasos (por ejemplo, menos no de obs que el no de parámetros a nivel individual) y cuando desea estimar estimaciones de nivel individual.
Sin embargo, los modelos HB no siempre son fáciles de estimar. Por lo tanto, aunque el análisis HB generalmente supera al análisis que no es HB, debe sopesar los costos relativos frente a los beneficios en función de su experiencia pasada y sus prioridades actuales en términos de tiempo y costo.
Una vez dicho esto, si no está interesado en las estimaciones de nivel individual, simplemente puede estimar un modelo de nivel agregado, pero incluso en estos contextos, estimar modelos agregados a través de HB utilizando estimaciones de nivel individual puede tener mucho sentido.
En resumen, ajustar los modelos HB es el enfoque recomendado siempre que tenga el tiempo y la paciencia para ajustarlos. Luego puede usar modelos agregados como punto de referencia para evaluar el rendimiento de su modelo HB.
fuente
Aprendí de Snijders y Bosker, Análisis multinivel: una introducción al modelado multinivel básico y avanzado. Creo que es muy bueno para los principiantes, debe ser porque soy un espeso en lo que respecta a estas cosas y tenía sentido para mí.
Secundo el Gelman y Hill también, un libro verdaderamente brillante.
fuente
Los modelos de niveles múltiples deben emplearse cuando los datos están anidados en una estructura jerárquica, particularmente cuando existen diferencias significativas entre las unidades de nivel superior en la variable dependiente (por ejemplo, la orientación del rendimiento del alumno varía entre los alumnos y también entre las clases con las que los alumnos están anidados). En estas circunstancias, las observaciones se agrupan en lugar de ser independientes. Si no se tiene en cuenta la agrupación, se subestiman los errores de las estimaciones de los parámetros, las pruebas de significación sesgadas y la tendencia a rechazar el valor nulo cuando se debe conservar. La justificación del uso de modelos multinivel, así como explicaciones exhaustivas de cómo llevar a cabo los análisis, es proporcionada por
Raudenbush, SW Bryk, AS (2002). Modelos lineales jerárquicos: aplicaciones y métodos de análisis de datos. 2da edición. Newbury Park, CA: Sabio.
El libro de R & B también está bien integrado con el paquete de software HLM de los autores, lo que ayuda mucho en el aprendizaje del paquete. En un artículo clásico se proporciona una explicación de por qué los modelos multinivel son necesarios y preferibles a algunas alternativas (como la codificación ficticia de las unidades de nivel superior).
Hoffman, DA (1997). Una visión general de la lógica y la lógica de los modelos lineales jerárquicos. Journal of Management, 23, 723-744.
El documento de Hoffman se puede descargar de forma gratuita si busca en Google "Hoffman 1997 HLM" y accede al pdf en línea.
fuente