La distinción entre variables estrictamente aleatorias (que deberían modelarse como tales) y variables no aleatorias que algunos argumentan que podrían modelarse como aleatorias si se trata de un modelo jerárquico / multinivel, me resulta borrosa.
Bates y Bolker ejemplifican los efectos aleatorios con casos de aleatoriedad verdadera, por ejemplo, la calidad de los productos en muestras seleccionadas al azar. Aunque su lme4
trabajo es increíble, aún no está claro dónde va la línea entre aleatorio y no aleatorio. Las discusiones en ciencias sociales hacen que esto sea aún más borroso. Los modelos multinivel / jerárquicos y los modelos de efectos aleatorios son computacionalmente iguales lme4
, entonces, ¿dónde dibujamos la línea?
Por ejemplo, tengo un conjunto de datos con medidas repetidas en varios individuos (¡eso es aleatorio!), Pero creo, y los resultados del lme4
programa muestran que una gran proporción de la variación se encuentra dentro de sus variables socioeconómicas (como el área de vida, la raza, etc.). Estas variables no son aleatorias, pero los modelos multinivel argumentan que podrían usarse como tales. Otros ejemplos provienen de estudios sobre las calificaciones de los estudiantes, que generalmente anidan estudiantes dentro de los maestros y más dentro de las escuelas. Todas estas variables son constantes.
¿Podemos modelar factores no aleatorios como aleatorios si es plausible en el ámbito de los modelos multinivel (jerárquicos)?
fuente
Respuestas:
Me sorprende tu pregunta. Sé que dices que entiendes los efectos fijos frente a los aleatorios, pero tal vez no los entiendas de la misma manera que yo. He publicado un extracto bastante extendido de un capítulo de un libro en prensa aquí que explica mi punto de vista (bastante pragmático, bastante alineado con el de Andrew Gelman).
Respondiendo más directamente a la pregunta:
Puede agregar claridad para distinguir entre las variables de agrupación (que deben ser categóricas), que representan los grupos a través de los cuales varían las cosas, y los efectos , que son las diferencias en algún parámetro / efecto (generalmente la intercepción, pero podrían ser los efectos del ingreso / educación / lo que sea) a través de los niveles de alguna variable de agrupación.
actualización : me tomaré la libertad de darle un contrapunto a su
No estoy seguro de lo que este significa. Sabes de qué vecindario proviene cada observación, ¿verdad? ¿Cómo es eso "no observado"? (Si sospechaba la agrupación en sus datos en función de factores no observados , necesitaría ajustar un modelo de mezcla discreta ). Si quiere decir que no sabe por qué los vecindarios son diferentes, no creo que eso importe aquí.
La única razón por la que puedo pensar en no usar el vecindario como un efecto aleatorio sería si solo hubiera medido un pequeño número (digamos <6) de vecindarios.
fuente