En la literatura sobre modelos jerárquicos / multinivel he leído a menudo sobre "modelos anidados" y "modelos no anidados", pero ¿qué significa esto? ¿Podría alguien darme algunos ejemplos o contarme sobre las implicaciones matemáticas de esta redacción?
61
Respuestas:
Anidado versus no anidado puede significar muchas cosas. Tiene diseños anidados versus diseños cruzados (consulte, por ejemplo, esta explicación ). Ha anidado modelos en la comparación de modelos. Anidado significa aquí que todos los términos de un modelo más pequeño ocurren en un modelo más grande. Esta es una condición necesaria para usar la mayoría de las pruebas de comparación de modelos, como las pruebas de razón de probabilidad.
En el contexto de los modelos multinivel, creo que es mejor hablar de factores anidados y no anidados. La diferencia está en cómo los diferentes factores están relacionados entre sí. En un diseño anidado, los niveles de un factor solo tienen sentido dentro de los niveles de otro factor.
Digamos que quieres medir la producción de oxígeno de las hojas. Muestras varias especies de árboles, y en cada árbol muestras algunas hojas en la parte inferior, en el medio y en la parte superior del árbol. Este es un diseño anidado. La diferencia para las hojas en una posición diferente solo tiene sentido dentro de una especie de árbol. Por lo tanto, comparar las hojas inferiores, las intermedias y las superiores sobre todos los árboles no tiene sentido. O dicho de otra manera: la posición de la hoja no debe modelarse como efecto principal.
Los factores no anidados son una combinación de dos factores que no están relacionados. Digamos que estudia pacientes y está interesado en la diferencia de edad y sexo. Por lo tanto, tiene un factor de clase de edad y un factor de género que no están relacionados. Debe modelar la edad y el género como efecto principal, y puede echar un vistazo a la interacción si es necesario.
La diferencia no siempre es tan clara. Si en mi primer ejemplo las especies arbóreas están estrechamente relacionadas en forma y fisiología, podría considerar la posición de la hoja también como un efecto principal válido. En muchos casos, la elección de un diseño anidado versus un diseño no anidado es más una decisión del investigador que un hecho real.
fuente
Los modelos anidados y no anidados aparecen en análisis conjunto y IIA . Considere el "problema del autobús rojo autobús azul". Tiene una población donde el 50% de las personas toma un automóvil para trabajar y el otro 50% toma el autobús rojo. ¿Qué sucede si agrega un bus azul que tiene las mismas especificaciones que el bus rojo a la ecuación? Un modelo logit multinomial pronosticará una participación del 33% para los tres modos. Intuitivamente, sabemos que esto no es correcto, ya que el autobús rojo y el autobús azul son más similares entre sí que con el automóvil y, por lo tanto, tomarán más parte unos de otros antes de tomar parte del automóvil. Ahí es donde entra una estructura de anidación, que generalmente se especifica como un coeficiente lambda en las alternativas similares.
Ben Akiva ha reunido un buen conjunto de diapositivas que describen la teoría sobre esto aquí . Comienza a hablar sobre logit anidado alrededor de la diapositiva 23.
fuente
La implicación principal si dos modelos están anidados es que es relativamente fácil compararlos estadísticamente. En pocas palabras, con los modelos anidados puede considerar que el más complejo se está construyendo agregando algo a un "modelo nulo" más simple. Para seleccionar lo mejor de estos dos modelos, por lo tanto, simplemente tiene que averiguar si eso agregado explica una cantidad significativa de variación adicional en los datos. Este escenario es en realidad equivalente a ajustar primero el modelo simple y eliminar su varianza pronosticada de los datos, y luego ajustar el componente adicional del modelo más complejo a los residuos del primer ajuste (al menos con una estimación de mínimos cuadrados).
Los modelos no anidados pueden explicar porciones de variación completamente diferentes en los datos. Un modelo complejo puede incluso explicar menos varianza que uno simple, si el complejo no incluye las "cosas correctas" que tiene el simple. Entonces, en ese caso, es un poco más difícil predecir lo que sucedería bajo la hipótesis nula de que ambos modelos explican los datos igualmente bien.
Más concretamente, bajo la hipótesis nula (y dados ciertos supuestos moderados), la diferencia en la bondad de ajuste entre dos modelos anidados sigue una distribución conocida, cuya forma depende solo de la diferencia en los grados de libertad entre los dos modelos. Esto no es cierto para los modelos no anidados.
fuente
Dos modelos están separados o separados si un modelo no puede obtenerse como límite del otro (o un modelo no es un caso particular del otro)
fuente
Preguntó sobre la diferencia entre modelos anidados y no anidados. Ver:
Donde el tema de modelos no anidados o separados fue tratado por primera vez o en mi próximo libro: Elección de modelos separados o no anidados .
fuente
Vea una respuesta más simple en este pdf . Esencialmente, un modelo anidado es un modelo con menos variables que un modelo completo. Una intención es buscar respuestas más parsimoniosas.
fuente