Estoy tratando de ampliar mi conocimiento de las estadísticas. Vengo de un fondo de ciencias físicas con un enfoque "basado en recetas" para las pruebas estadísticas, donde decimos que es continuo, normalmente se distribuye: regresión OLS .
En mi lectura he encontrado los términos: modelo de efectos aleatorios, modelo de efectos fijos, modelo marginal. Mis preguntas son:
- En términos muy simples, ¿qué son?
- Cuáles son las diferencias entre ellos?
- ¿Alguno de ellos es sinónimo?
- ¿Dónde caen en esta clasificación las pruebas tradicionales como la regresión OLS, ANOVA y ANCOVA?
Solo trato de decidir a dónde ir después con el autoestudio.
Respuestas:
Esta pregunta se ha discutido parcialmente en este sitio como a continuación, y las opiniones parecen mixtas.
Todos los términos están generalmente relacionados con datos longitudinales / panel / agrupados / jerárquicos y medidas repetidas (en el formato de regresión avanzada y ANOVA), pero tienen múltiples significados en diferentes contextos. Me gustaría responder la pregunta en fórmulas basadas en mi conocimiento.
Modelo de efectos fijos
Modelo de efectos aleatorios
Modelo marginal
El modelo marginal generalmente se compara con el modelo condicional (modelo de efectos aleatorios), y el primero se centra en la media de la población (tome el modelo lineal como ejemplo) mientras que el último trata de la media condicionalLa interpretación y la escala de los coeficientes de regresión entre el modelo marginal y el modelo de efectos aleatorios serían diferentes para los modelos no lineales (por ejemplo, la regresión logística). Sea , entonces
fuente
Corrígeme si me equivoco aquí:
Conceptualmente, hay cuatro efectos posibles: intercepción fija, coeficiente fijo, intercepción aleatoria, coeficiente aleatorio. La mayoría de los modelos de regresión son 'efectos aleatorios', por lo que tienen intercepciones aleatorias y coeficientes aleatorios. El término 'efecto aleatorio' entró en uso en contraste con 'efecto fijo'.
El 'efecto fijo' es cuando una variable afecta a parte de la muestra, pero no a toda. La versión más simple de un modelo de efectos fijos (conceptualmente) sería una variable ficticia, para un efecto fijo con un valor binario. Estos modelos tienen una sola intersección aleatoria, coeficientes de efectos fijos y coeficientes variables aleatorios.
El siguiente nivel de complicación (conceptualmente) es cuando el efecto fijo no es binario, sino nominal, con muchos valores. En este caso, lo que se genera es un modelo con muchas intersecciones (uno para cada uno de los valores nominales). Aquí es donde obtienes las clásicas 'líneas múltiples' de un modelo de datos de panel , donde cada una de las 'opciones' de una variable de efecto fijo obtiene su propio efecto. La virtud de incluir todas las diferentes series de datos específicos de factores en una sola regresión (en lugar de hacer que cada factor del efecto fijo sea su propia regresión) es que puedes agrupar la varianza de todos los diferentes efectos en una ecuación, y así obtenga mejores (más seguros) valores para todos sus coeficientes.
El "nivel tres" de complicación sería cuando el "efecto fijo" es en sí mismo una variable aleatoria, excepto que sus efectos son "fijos" para afectar solo un subconjunto de la muestra. En ese momento, el modelo tendría una intersección aleatoria, múltiples intersecciones fijas y múltiples variables aleatorias. Creo que esto es lo que se conoce como modelo de 'efectos mixtos'.
Los modelos de 'efectos mixtos' se utilizan para el modelado multinivel (MLM), ya que los 'efectos fijos' se pueden usar para anidar un subconjunto de datos dentro de otro. Esta agrupación puede tener múltiples niveles, con estudiantes anidados en aulas, anidados en escuelas. La escuela tiene un efecto fijo en las aulas y las aulas en los estudiantes. (La escuela puede o no ser un efecto fijo en el estudiante, dependiendo del diseño experimental, no estoy seguro)
Los modelos de datos de panel son modelos de 'efecto mixto', pero usan dos dimensiones para la agrupación, generalmente tiempo y algún tipo de categoría.
fuente