Diferencia entre datos de panel y modelo mixto

14

Me gustaría saber la diferencia entre el análisis de datos de panel y el análisis de modelo mixto. Que yo sepa, tanto los datos de panel como los modelos mixtos usan efectos fijos y aleatorios. Si es así, ¿por qué tienen nombres diferentes? ¿O son sinónimos?

He leído la siguiente publicación, que describe la definición de efecto fijo, aleatorio y mixto, pero no responde exactamente a mi pregunta: ¿Cuál es la diferencia entre los modelos de efecto fijo, efecto aleatorio y efecto mixto?

También estaría agradecido si alguien pudiera referirme a una breve referencia (alrededor de 200 páginas) sobre análisis de modelos mixtos. Solo para agregar, preferiría una referencia de modelado mixto independientemente del tratamiento del software. Explicación principalmente teórica del modelado mixto.

mixed-model references panel-data Beta
fuente

Relacionado: stats.stackexchange.com/questions/171313/…

rightskewed

Relacionado: stats.stackexchange.com/questions/238214

dice Reinstate Monica

22

Tanto los datos de panel y mezclado oferta de datos modelo de efectos con dobles variables aleatorias indexadas $y_{ij}$ . El primer índice es para grupo, el segundo es para individuos dentro del grupo. Para los datos del panel, el segundo índice suele ser el tiempo, y se supone que observamos individuos a lo largo del tiempo. Cuando el tiempo es el segundo índice para el modelo de efectos mixtos, los modelos se denominan modelos longitudinales. El modelo de efectos mixtos se entiende mejor en términos de regresiones de 2 niveles. (Para facilitar la exposición, suponga solo una variable explicativa)

La regresión de primer nivel es la siguiente

y_{i j} = α_{i} + x_{i j} β_{i} + ε_{i j} .

$y_{ij}=\alpha_i+x_{ij}\beta_i+\varepsilon_{ij}.$

Esto se explica simplemente como una regresión individual para cada grupo. La regresión de segundo nivel intenta explicar la variación en los coeficientes de regresión:

α_{i} = γ_{0} + z_{i 1} γ_{1} + u_{i}

$\alpha_i=\gamma_0+z_{i1}\gamma_1+u_i$

β_{i} = δ_{0} + z_{i 2} δ_{1} + v_{i}

$\beta_i=\delta_0+z_{i2}\delta_1+v_i$

Cuando sustituyes la segunda ecuación por la primera, obtienes

y_{i j} = γ_{0} + z_{i 1} γ_{1} + x_{i j} δ_{0} + x_{i j} z_{i 2} δ_{1} + u_{i} + x_{i j} v_{i} + ε_{i j}

$y_{ij}=\gamma_0+z_{i1}\gamma_1+x_{ij}\delta_0+x_{ij}z_{i2}\delta_1+u_i+x_{ij}v_i+\varepsilon_{ij}$

Los efectos fijos son lo que es fijo, esto significa $\gamma_0,\gamma_1,\delta_0,\delta_1$ . Los efectos aleatorios son y . $u_i$ $v_i$

Ahora, para los datos del panel, la terminología cambia, pero aún puede encontrar puntos comunes. Los modelos de efectos aleatorios de datos de panel son los mismos que el modelo de efectos mixtos

α_{i} = γ_{0} + u_{i}

$\alpha_i=\gamma_0+u_i$

β_{i} = δ_{0}

$\beta_i=\delta_0$

con modelo convirtiéndose

y_{i t} = γ_{0} + x_{i t} δ_{0} + u_{i} + ε_{i t},

$y_{it}=\gamma_0+x_{it}\delta_0+u_i+\varepsilon_{it},$

donde $u_i$ son efectos aleatorios.

La diferencia más importante entre el modelo de efectos mixtos y los modelos de datos de panel es el tratamiento de regresores $x_{ij}$ . Para los modelos de efectos mixtos son variables no aleatorias, mientras que para los modelos de datos de panel siempre se supone que son aleatorios. Esto se vuelve importante cuando se establece qué es el modelo de efectos fijos para los datos del panel.

Para el modelo de efectos mixtos se supone que los efectos aleatorios y son independientes de y también de y , lo que siempre es cierto cuando y son fijos. Si permitimos el estocástico esto se vuelve importante. Entonces, el modelo de efectos aleatorios para datos de panel supone que no está correlacionado con . Pero el modelo de efectos fijos que tiene la misma forma $u_i$ $v_i$ $\varepsilon_{ij}$ $x_{ij}$ $z_i$ $x_{ij}$ $z_i$ $x_{ij}$ $x_{it}$ $u_i$

y_{i t} = γ_{0} + x_{i t} δ_{0} + u_{i} + ε_{i t},

$y_{it}=\gamma_0+x_{it}\delta_0+u_i+\varepsilon_{it},$

permite la correlación de y . El énfasis entonces es únicamente para estimar consistentemente . Esto se hace restando los medios individuales: $x_{it}$ $u_i$ $\delta_0$

y_{i t} - {\bar{y}}_{i .} = (x_{i t} - {\bar{x}}_{i .}) δ_{0} + ε_{i t} - {\bar{ε}}_{i .},

$y_{it}-\bar{y}_{i.}=(x_{it}-\bar{x}_{i.})\delta_0+\varepsilon_{it}-\bar{\varepsilon}_{i.},$

y usando OLS simple en el problema de regresión resultante. Algebraicamente Esto coincide con menos problema de regresión variable ficticia plaza, donde suponemos que son parámetros fijos. De ahí el nombre modelo de efectos fijos. $u_i$

Hay mucha historia detrás de la terminología de efectos fijos y efectos aleatorios en la econometría de datos de panel, que omití. En mi opinión personal, estos modelos se explican mejor en el " Análisis econométrico de la sección transversal y los datos del panel " de Wooldridge . Por lo que sé, no existe tal historia en el modelo de efectos mixtos, pero por otro lado, vengo de antecedentes econométricos, por lo que podría estar equivocado.

mpiktas
fuente

. . . + x_{i j} v_{i} + u_{i} + ε_{i j}

$...+x_{ij}v_{i}+u_{i}+\varepsilon_{ij}$

¡Esta explicación es maravillosa! Muchas gracias por tomar todo el esfuerzo para darme una exposición tan maravillosa. Solo quiero preguntar una cosa. ¿Qué quieres decir con regresión de 2 niveles?

Beta

2

@Ari, la regresión de segundo nivel es una regresión para los coeficientes de regresión de la regresión de primer nivel. La regresión de primer nivel intenta explicar la variación dentro del grupo, mientras que la regresión de segundo nivel intenta explicar la variación entre grupos. Esta división es artificial, pero me gusta ya que al menos me parece natural. Este tipo de división también se usa en modelos jerárquicos de Bayes.

mpiktas

δ_{0}

$\delta_0$

3

Entiendo que está buscando un texto que describa la teoría de modelado mixto sin referencia a un paquete de software.

Recomendaría el análisis multinivel, una introducción al modelado multinivel básico y avanzado de Tom Snijders y Roel Bosker, aproximadamente 250pp. Tiene un capítulo sobre software al final (que está algo desactualizado ahora) pero el resto es una teoría muy accesible.

Sin embargo, debo decir que estoy de acuerdo con la recomendación anterior para Modelos multinivel y longitudinales que usan Stata por Sophia Rabe-Hesketh y Anders Skrondal. El libro es muy teórico y el componente de software es realmente una buena adición a un texto sustancial. Normalmente no uso Stata y tengo el texto en mi escritorio y lo encuentro extremadamente bien escrito. Sin embargo, es mucho más largo que 200pp.

Los siguientes textos están escritos por expertos actuales en el campo y serían útiles para cualquiera que desee más información sobre estas técnicas (aunque no se ajustan específicamente a su solicitud): [No puedo vincularlas porque soy un nuevo usuario, lo siento]

Hoox, Joop (2010). Análisis multinivel, técnicas y aplicaciones.

Gelman, A. y Hill, J. (2006) Análisis de datos utilizando regresión y modelos multinivel / jerárquicos.

Singer, J. (2003) Análisis de datos longitudinales aplicados: cambio de modelado y ocurrencia de eventos

Raudenbush, SW, y Bryk, A., S. (2002). Modelos lineales jerárquicos: aplicaciones y métodos de análisis de datos

Luke, Douglas, (2004). Modelado multinivel

También recomendaría el texto de Wooldridge mencionado anteriormente, así como el texto de R, y el Centro Universitario de B pistola de Modelado Multinivel tiene un montón de tutoriales e información

juega de nuevo
fuente

Gracias Playitagain! Esta es una información muy útil. Incluso su nombre es interesante :)

Beta

2

Yo también me he preguntado acerca de la diferencia entre ambos y de haber encontrado recientemente una referencia sobre este tema, entiendo que los "datos del panel" es un nombre tradicional para conjuntos de datos que representan una "sección transversal o grupo de personas que son encuestadas periódicamente durante lapso de tiempo dado ". Por lo tanto, el "panel" es una estructura de grupo dentro del conjunto de datos, y tener dicho grupo es la forma más natural de analizar este tipo de datos a través de un enfoque de modelado mixto.

Una buena referencia (independientemente de si "habla" R o no) sobre el modelado de efectos mixtos es el borrador de un próximo libro (?) De Douglas Bates ( lme4: Modelado de efectos mixtos con R ).

ils
fuente

1

Gracias por la referencia! Pero el problema aún persiste.

Beta el

2

@mpiktas ha dado una respuesta completa. También sugeriría leer el Capítulo 7 de la documentación para el paquete de PLM en I . Vale la pena leer la discusión de los autores sobre la diferencia entre los modelos mixtos y los datos del panel.

KarthikS
fuente

1

Si usa modelos Stata, multinivel y longitudinales, usar Stata de Sophia Rabe-Hesketh y Anders Skrondal sería una buena opción. Dependiendo de lo que le interese exactamente, 200 páginas podrían ser correctas.

Dimitriy V. Masterov
fuente

Gracias Dimitriy por la referencia. Pero desafortunadamente no uso STATA. Principalmente uso SAS, y a veces R. Pero gracias de todos modos.

Beta

2

He escuchado cosas buenas sobre wiley.com/WileyCDA/WileyTitle/productCd-0470073713.html , pero no lo he leído yo mismo.

Dimitriy V. Masterov

Gracias Dimitriy! Esto se ve muy prometedor. La ventaja de hacer preguntas en lugar de gafas es que obtienes resultados realmente buenos :)

Beta

1

En mi experiencia, la razón para usar la 'econometría de panel' es que los estimadores de 'efectos fijos' del panel pueden usarse para controlar diversas formas de sesgo variable omitido.

Sin embargo, es posible realizar este tipo de estimación dentro de un modelo multinivel utilizando un enfoque de tipo Mundlak , es decir, incluyendo los medios grupales como regresores adicionales. Este enfoque elimina la correlación entre el término de error y los factores omitidos a nivel de grupo potencial, revelando el coeficiente 'dentro'. Sin embargo, por una razón desconocida para mí, esto no suele hacerse en la investigación aplicada. Estas diapositivas y este documento proporcionan una elaboración.

EddieMcGoldrick
fuente

(+1) Los sociólogos a menudo interpretan los medios grupales como efectos contextuales (aunque esto es más frecuente para datos transversales anidados que para datos de panel de series de tiempo). Necesitaré leer, de la nota relacionada Manski (1993) ( PDF aquí ) tiene un artículo que muestra cómo estos efectos contextuales con frecuencia no se identifican. Por "razones por las que esto no se hace", sospecho que hay tanta diferencia entre la práctica de las ciencias sociales como cualquier otra cosa, podría ser una buena pregunta.

Andy W

Diferencia entre datos de panel y modelo mixto

Respuestas: