Me gustaría saber la diferencia entre el análisis de datos de panel y el análisis de modelo mixto. Que yo sepa, tanto los datos de panel como los modelos mixtos usan efectos fijos y aleatorios. Si es así, ¿por qué tienen nombres diferentes? ¿O son sinónimos?
He leído la siguiente publicación, que describe la definición de efecto fijo, aleatorio y mixto, pero no responde exactamente a mi pregunta: ¿Cuál es la diferencia entre los modelos de efecto fijo, efecto aleatorio y efecto mixto?
También estaría agradecido si alguien pudiera referirme a una breve referencia (alrededor de 200 páginas) sobre análisis de modelos mixtos. Solo para agregar, preferiría una referencia de modelado mixto independientemente del tratamiento del software. Explicación principalmente teórica del modelado mixto.
Respuestas:
Tanto los datos de panel y mezclado oferta de datos modelo de efectos con dobles variables aleatorias indexadasyij . El primer índice es para grupo, el segundo es para individuos dentro del grupo. Para los datos del panel, el segundo índice suele ser el tiempo, y se supone que observamos individuos a lo largo del tiempo. Cuando el tiempo es el segundo índice para el modelo de efectos mixtos, los modelos se denominan modelos longitudinales. El modelo de efectos mixtos se entiende mejor en términos de regresiones de 2 niveles. (Para facilitar la exposición, suponga solo una variable explicativa)
La regresión de primer nivel es la siguiente
Esto se explica simplemente como una regresión individual para cada grupo. La regresión de segundo nivel intenta explicar la variación en los coeficientes de regresión:
β i = δ 0 + z i 2 δ 1 + v i
Cuando sustituyes la segunda ecuación por la primera, obtienes
Los efectos fijos son lo que es fijo, esto significaγ0,γ1,δ0,δ1 . Los efectos aleatorios son y v i .ui vi
Ahora, para los datos del panel, la terminología cambia, pero aún puede encontrar puntos comunes. Los modelos de efectos aleatorios de datos de panel son los mismos que el modelo de efectos mixtos
β i = δ 0
con modelo convirtiéndose
dondeui son efectos aleatorios.
La diferencia más importante entre el modelo de efectos mixtos y los modelos de datos de panel es el tratamiento de regresoresxij . Para los modelos de efectos mixtos son variables no aleatorias, mientras que para los modelos de datos de panel siempre se supone que son aleatorios. Esto se vuelve importante cuando se establece qué es el modelo de efectos fijos para los datos del panel.
Para el modelo de efectos mixtos se supone que los efectos aleatorios y v i son independientes de ε i j y también de x i j y z i , lo que siempre es cierto cuando x i j y z i son fijos. Si permitimos el estocástico x i j esto se vuelve importante. Entonces, el modelo de efectos aleatorios para datos de panel supone que x i t no está correlacionado con u i . Pero el modelo de efectos fijos que tiene la misma formaui vi εij xij zi xij zi xij xit ui
permite la correlación de y u i . El énfasis entonces es únicamente para estimar consistentemente δ 0 . Esto se hace restando los medios individuales:xit ui δ0
y usando OLS simple en el problema de regresión resultante. Algebraicamente Esto coincide con menos problema de regresión variable ficticia plaza, donde suponemos que son parámetros fijos. De ahí el nombre modelo de efectos fijos.ui
Hay mucha historia detrás de la terminología de efectos fijos y efectos aleatorios en la econometría de datos de panel, que omití. En mi opinión personal, estos modelos se explican mejor en el " Análisis econométrico de la sección transversal y los datos del panel " de Wooldridge . Por lo que sé, no existe tal historia en el modelo de efectos mixtos, pero por otro lado, vengo de antecedentes econométricos, por lo que podría estar equivocado.
fuente
Entiendo que está buscando un texto que describa la teoría de modelado mixto sin referencia a un paquete de software.
Recomendaría el análisis multinivel, una introducción al modelado multinivel básico y avanzado de Tom Snijders y Roel Bosker, aproximadamente 250pp. Tiene un capítulo sobre software al final (que está algo desactualizado ahora) pero el resto es una teoría muy accesible.
Sin embargo, debo decir que estoy de acuerdo con la recomendación anterior para Modelos multinivel y longitudinales que usan Stata por Sophia Rabe-Hesketh y Anders Skrondal. El libro es muy teórico y el componente de software es realmente una buena adición a un texto sustancial. Normalmente no uso Stata y tengo el texto en mi escritorio y lo encuentro extremadamente bien escrito. Sin embargo, es mucho más largo que 200pp.
Los siguientes textos están escritos por expertos actuales en el campo y serían útiles para cualquiera que desee más información sobre estas técnicas (aunque no se ajustan específicamente a su solicitud): [No puedo vincularlas porque soy un nuevo usuario, lo siento]
Hoox, Joop (2010). Análisis multinivel, técnicas y aplicaciones.
Gelman, A. y Hill, J. (2006) Análisis de datos utilizando regresión y modelos multinivel / jerárquicos.
Singer, J. (2003) Análisis de datos longitudinales aplicados: cambio de modelado y ocurrencia de eventos
Raudenbush, SW, y Bryk, A., S. (2002). Modelos lineales jerárquicos: aplicaciones y métodos de análisis de datos
Luke, Douglas, (2004). Modelado multinivel
También recomendaría el texto de Wooldridge mencionado anteriormente, así como el texto de R, y el Centro Universitario de B pistola de Modelado Multinivel tiene un montón de tutoriales e información
fuente
Yo también me he preguntado acerca de la diferencia entre ambos y de haber encontrado recientemente una referencia sobre este tema, entiendo que los "datos del panel" es un nombre tradicional para conjuntos de datos que representan una "sección transversal o grupo de personas que son encuestadas periódicamente durante lapso de tiempo dado ". Por lo tanto, el "panel" es una estructura de grupo dentro del conjunto de datos, y tener dicho grupo es la forma más natural de analizar este tipo de datos a través de un enfoque de modelado mixto.
Una buena referencia (independientemente de si "habla" R o no) sobre el modelado de efectos mixtos es el borrador de un próximo libro (?) De Douglas Bates ( lme4: Modelado de efectos mixtos con R ).
fuente
@mpiktas ha dado una respuesta completa. También sugeriría leer el Capítulo 7 de la documentación para el paquete de PLM en I . Vale la pena leer la discusión de los autores sobre la diferencia entre los modelos mixtos y los datos del panel.
fuente
Si usa modelos Stata, multinivel y longitudinales, usar Stata de Sophia Rabe-Hesketh y Anders Skrondal sería una buena opción. Dependiendo de lo que le interese exactamente, 200 páginas podrían ser correctas.
fuente
En mi experiencia, la razón para usar la 'econometría de panel' es que los estimadores de 'efectos fijos' del panel pueden usarse para controlar diversas formas de sesgo variable omitido.
Sin embargo, es posible realizar este tipo de estimación dentro de un modelo multinivel utilizando un enfoque de tipo Mundlak , es decir, incluyendo los medios grupales como regresores adicionales. Este enfoque elimina la correlación entre el término de error y los factores omitidos a nivel de grupo potencial, revelando el coeficiente 'dentro'. Sin embargo, por una razón desconocida para mí, esto no suele hacerse en la investigación aplicada. Estas diapositivas y este documento proporcionan una elaboración.
fuente