En términos simples, ¿cómo explicaría (quizás con ejemplos simples) la diferencia entre los modelos de efectos fijos, de efectos aleatorios y de efectos mixtos?
269
En términos simples, ¿cómo explicaría (quizás con ejemplos simples) la diferencia entre los modelos de efectos fijos, de efectos aleatorios y de efectos mixtos?
Respuestas:
El estadístico Andrew Gelman dice que los términos 'efecto fijo' y 'efecto aleatorio' tienen significados variables dependiendo de quién los use. Quizás pueda elegir cuál de las 5 definiciones se aplica a su caso. En general, puede ser mejor buscar ecuaciones que describan el modelo de probabilidad que usan los autores (al leer) o escribir el modelo de probabilidad completo que desea usar (al escribir).
fuente
(4) “If an effect is assumed to be a realized value of a random variable, it is called a random effect.” (LaMotte, 1983)
Hay buenos libros sobre esto, como Gelman y Hill . Lo que sigue es esencialmente un resumen de su perspectiva.
En primer lugar, no debe quedar demasiado atrapado en la terminología. En estadística, la jerga nunca debe usarse como un sustituto de una comprensión matemática de los modelos mismos. Eso es especialmente cierto para los modelos de efectos aleatorios y mixtos. "Mixto" solo significa que el modelo tiene efectos fijos y aleatorios, así que centrémonos en la diferencia entre fijo y aleatorio.
Efectos aleatorios versus efectos fijos
Digamos que tiene un modelo con un predictor categórico, que divide sus observaciones en grupos de acuerdo con los valores de la categoría. * Los coeficientes del modelo, o "efectos", asociados a ese predictor pueden ser fijos o aleatorios. La diferencia práctica más importante entre los dos es esta:
Los efectos aleatorios se estiman con agrupación parcial, mientras que los efectos fijos no.
La agrupación parcial significa que, si tiene pocos puntos de datos en un grupo, la estimación del efecto del grupo se basará parcialmente en los datos más abundantes de otros grupos. Esto puede ser un buen compromiso entre estimar un efecto al agrupar completamente todos los grupos, lo que enmascara la variación a nivel de grupo, y estimar un efecto para todos los grupos completamente por separado, lo que podría dar estimaciones pobres para grupos de muestra baja.
Los efectos aleatorios son simplemente la extensión de la técnica de agrupamiento parcial como modelo estadístico de propósito general. Esto permite la aplicación de principios de la idea a una amplia variedad de situaciones, incluidos múltiples predictores, variables mixtas continuas y categóricas, y estructuras de correlación complejas. (Pero con un gran poder viene una gran responsabilidad: la complejidad del modelado y la inferencia se incrementa sustancialmente, y puede dar lugar a sesgos sutiles que requieren una sofisticación considerable para evitar).
Para motivar el modelo de efectos aleatorios, pregúntese: ¿por qué agruparía parcialmente? Probablemente porque crees que los pequeños subgrupos son parte de un grupo más grande con un efecto medio común. Las medias del subgrupo pueden desviarse un poco de la media del grupo grande, pero no en una cantidad arbitraria. Para formalizar esa idea, postulamos que las desviaciones siguen una distribución, típicamente gaussiana. Ahí es donde entra lo "aleatorio" en los efectos aleatorios: estamos asumiendo que las desviaciones de los subgrupos de un padre siguen la distribución de una variable aleatoria. Una vez que tenga esta idea en mente, las ecuaciones del modelo de efectos mixtos siguen naturalmente.
Desafortunadamente, la confusión de conceptos causada por estos términos ha llevado a una profusión de definiciones conflictivas . De las cinco definiciones en este enlace, solo el n. ° 4 es completamente correcto en el caso general, pero tampoco es completamente informativo. Debe leer artículos y libros completos (o, en su defecto, esta publicación) para comprender qué implica esa definición en el trabajo práctico.
Ejemplo
Veamos un caso en el que el modelado de efectos aleatorios podría ser útil. Suponga que desea estimar el ingreso promedio de los hogares de EE. UU. Por código postal. Tiene un gran conjunto de datos que contiene observaciones de los ingresos y códigos postales de los hogares. Algunos códigos postales están bien representados en el conjunto de datos, pero otros tienen solo un par de hogares.
Para su modelo inicial, lo más probable es que tome el ingreso promedio en cada ZIP. Esto funcionará bien cuando tenga muchos datos para un ZIP, pero las estimaciones para sus ZIP mal muestreados sufrirán una gran variación. Puede mitigar esto mediante el uso de un estimador de contracción (también conocido como agrupación parcial), que empujará los valores extremos hacia el ingreso promedio en todos los códigos postales.
Pero, ¿cuánta contracción / agrupación debe hacer para un ZIP en particular? Intuitivamente, debe depender de lo siguiente:
Si modela el código postal como un efecto aleatorio, la estimación del ingreso promedio en todos los códigos postales estará sujeta a una contracción estadísticamente bien fundada, teniendo en cuenta todos los factores anteriores.
La mejor parte es que los modelos de efectos aleatorios y mixtos manejan automáticamente (4), la estimación de variabilidad, para todos los efectos aleatorios en el modelo. Esto es más difícil de lo que parece a primera vista: podría probar la varianza de la media muestral para cada ZIP, pero esta será sesgada, porque parte de la varianza entre las estimaciones para diferentes ZIPs es solo una muestra de varianza. En un modelo de efectos aleatorios, el proceso de inferencia toma en cuenta la varianza de muestreo y reduce la estimación de varianza en consecuencia.
Habiendo contabilizado (1) - (4), un modelo de efectos aleatorios / mixtos es capaz de determinar la contracción apropiada para grupos de muestra baja. También puede manejar modelos mucho más complicados con muchos predictores diferentes.
Relación con el modelado bayesiano jerárquico
Si esto le parece un modelo bayesiano jerárquico, tiene razón: es un pariente cercano pero no idéntico. Los modelos de efectos mixtos son jerárquicos en el sentido de que presentan distribuciones para parámetros latentes y no observados, pero generalmente no son completamente bayesianos porque los hiperparámetros de nivel superior no recibirán los antecedentes adecuados. Por ejemplo, en el ejemplo anterior, lo más probable es que tratemos el ingreso medio en un ZIP determinado como una muestra de una distribución normal, con una media y sigma desconocidas que se estimarán mediante el proceso de ajuste de efectos mixtos. Sin embargo, un modelo de efectos mixtos (no bayesianos) generalmente no tendrá un previo sobre la media y sigma desconocidas, por lo que no es completamente bayesiano. Dicho esto, con un conjunto de datos de tamaño decente, el modelo de efectos mixtos estándar y la variante completamente bayesiana a menudo darán resultados muy similares.
* Si bien muchos tratamientos de este tema se centran en una definición estrecha de "grupo", el concepto es de hecho muy flexible: es solo un conjunto de observaciones que comparten una propiedad común. Un grupo podría estar compuesto por múltiples observaciones de una sola persona, o varias personas en una escuela, o varias escuelas en un distrito, o múltiples variedades de un solo tipo de fruta, o múltiples tipos de vegetales de la misma cosecha, o múltiples cosechas. del mismo tipo de verdura, etc. Cualquier variable categórica se puede utilizar como una variable de agrupación.
fuente
He escrito sobre esto en un capítulo de libro sobre modelos mixtos (capítulo 13 en Fox, Negrete-Yankelevich y Sosa 2014 ); las páginas relevantes (pp. 311-315) están disponibles en Google Books . Creo que la pregunta se reduce a "¿cuáles son las definiciones de efectos fijos y aleatorios?" (un "modelo mixto" es solo un modelo que contiene ambos). Mi discusión dice un poco menos sobre su definición formal (para lo cual me referiría al documento de Gelman vinculado por la respuesta de @ JohnSalvatier anterior) y más sobre sus propiedades prácticas y utilidad. Aquí hay algunos extractos:
fuente
Efecto fijo: algo que el experimentador manipula directamente y que a menudo es repetible, por ejemplo, la administración de medicamentos: un grupo recibe medicamentos, un grupo recibe placebo.
Efecto aleatorio: fuente de variación aleatoria / unidades experimentales, por ejemplo, individuos extraídos (al azar) de una población para un ensayo clínico. Efectos aleatorios estima la variabilidad
Efecto mixto: incluye ambos, el efecto fijo en estos casos es estimar los coeficientes del nivel de población, mientras que los efectos aleatorios pueden explicar las diferencias individuales en respuesta a un efecto, por ejemplo, cada persona recibe tanto el medicamento como el placebo en diferentes ocasiones, el fijo Efecto estima el efecto de la droga, los términos de efectos aleatorios permitirían que cada persona responda a la droga de manera diferente.
Categorías generales de efectos mixtos: medidas repetidas, longitudinales, jerárquicas, parcelas divididas.
fuente
Llegué a esta pregunta desde aquí , un posible duplicado.
Ya hay varias respuestas excelentes, pero como se indica en la respuesta aceptada, hay muchos usos diferentes (pero relacionados) del término, por lo que podría ser valioso dar la perspectiva empleada en econometría, que todavía no parece abordarse completamente aquí. .
m
Aquí está el código que genera los datos y que produce una estimación RE positiva y una estimación FE "correcta" y negativa. (Dicho esto, las estimaciones de RE a menudo también serán negativas para otras semillas, ver arriba).
La salida:
fuente
La distinción solo es significativa en el contexto de las estadísticas no bayesianas. En las estadísticas bayesianas, todos los parámetros del modelo son "aleatorios".
fuente
En econometría, los términos se aplican típicamente en modelos lineales generalizados, donde el modelo tiene la forma
En modelos lineales , la presencia de un efecto aleatorio no da como resultado una inconsistencia del estimador OLS. Sin embargo, el uso de un estimador de efectos aleatorios (como mínimos cuadrados generalizados factibles) dará como resultado un estimador más eficiente .
En modelos no lineales , como probit, tobit, ..., la presencia de un efecto aleatorio, en general, dará como resultado un estimador inconsistente. El uso de un estimador de efectos aleatorios restaurará la consistencia.
Para los modelos lineales y no lineales, los efectos fijos resultan en un sesgo. Sin embargo, en los modelos lineales hay transformaciones que se pueden usar (como las primeras diferencias o degradantes), donde OLS en los datos transformados dará como resultado estimaciones consistentes. Para los modelos no lineales, hay algunas excepciones donde existen transformaciones, logit de efectos fijos es un ejemplo.
Ejemplo: efectos aleatorios probit. Suponer
y el resultado observado es
El estimador de máxima verosimilitud agrupado minimiza el promedio muestral de
Por supuesto, aquí el registro y el producto se simplifican, pero por razones pedagógicas, esto hace que la ecuación sea más comparable al estimador de efectos aleatorios, que tiene la forma
Podemos, por ejemplo, aproximar la integral por aleatorización tomando sorteos de normales al azar y evaluando la probabilidad de cada uno.R
La intuición es la siguiente: no sabemos qué tipo, , es cada observación. En cambio, evaluamos el producto de las probabilidades a lo largo del tiempo para una secuencia de sorteos. El tipo más probable para la observación tendrá la mayor probabilidad en todos los períodos y por lo tanto va a dominar la contribución probabilidad de que -secuencia de observaciones. i Tαi i T
fuente
No es realmente una definición formal, pero me gustan las siguientes diapositivas: Modelos mixtos y por qué los sociolingüistas deberían usarlos ( espejo ), de Daniel Ezra Johnson. Se ofrece una breve recapitulación en la diapositiva 4. Aunque se centró principalmente en estudios psicolingüísticos, es muy útil como primer paso.
fuente
Otra perspectiva muy práctica sobre modelos de efectos aleatorios y fijos proviene de la econometría cuando se realizan regresiones lineales en datos de panel . Si está estimando la asociación entre una variable explicativa y una variable de resultado en un conjunto de datos con múltiples muestras por individuo / grupo, este es el marco que desea usar.
Un buen ejemplo de los datos del panel son las mediciones anuales de un conjunto de individuos de:
Si intentamos comprender la relación entre el ejercicio y el cambio de peso, configuraremos la siguiente regresión:
e x e r c i s e i t + β 1 g e n d e r i + α i + ϵ i tΔweightit=β0 exerciseit+β1genderi+αi+ϵit
Entonces, la pregunta clave es determinar qué modelo es apropiado. La respuesta es la prueba de Hausman . Para usarlo, realizamos la regresión de efectos fijos y aleatorios, y luego aplicamos la prueba de Hausman para ver si sus coeficientes estimados difieren significativamente. Si divergen, la endogeneidad está en juego y un modelo de efectos fijos es la mejor opción. De lo contrario, iremos con efectos aleatorios.
fuente