¿Cómo se relaciona ARMA / ARIMA con el modelado de efectos mixtos?

14

En el análisis de datos de panel, he utilizado modelos de varios niveles con efectos aleatorios / mixtos para tratar problemas de autocorrelación (es decir, las observaciones se agrupan dentro de los individuos a lo largo del tiempo) con otros parámetros agregados para ajustar algunas especificaciones de tiempo y choques de interés. . ARMA / ARIMA parecen diseñados para abordar problemas similares.

Los recursos que he encontrado en línea discuten sobre series de tiempo (ARMA / ARIMA) o modelos de efectos mixtos, pero más allá de basarse en la regresión, no entiendo la relación entre los dos. ¿Podría uno querer usar ARMA / ARIMA desde un modelo multinivel? ¿Hay algún sentido en el que los dos son equivalentes o redundantes?

Respuestas o punteros a los recursos que discuten esto sería genial.

Benjamin Mako Hill
fuente

Respuestas:

11

Creo que la forma más simple de verlo es notar que ARMA y modelos similares están diseñados para hacer cosas diferentes a los modelos de niveles múltiples, y usar datos diferentes.

El análisis de series de tiempo generalmente tiene series de tiempo largas (posiblemente de cientos o incluso miles de puntos de tiempo) y el objetivo principal es observar cómo cambia una sola variable con el tiempo. Existen métodos sofisticados para tratar muchos problemas, no solo la autocorrelación, sino también la estacionalidad y otros cambios periódicos, etc.

Los modelos multinivel son extensiones de regresión. Usualmente tienen relativamente pocos puntos de tiempo (aunque pueden tener muchos) y el objetivo principal es examinar la relación entre una variable dependiente y varias variables independientes. Estos modelos no son tan buenos para manejar relaciones complejas entre una variable y un tiempo, en parte porque generalmente tienen menos puntos de tiempo (es difícil ver la estacionalidad si no tiene datos múltiples para cada temporada).

Peter Flom - Restablece a Monica
fuente
1
: Peter Muy buen resumen. Solo agregaría que los datos de series de tiempo no suelen ser "largos" cuando se trata de datos semanales / mensuales / anuales, PERO pueden ser largos cuando se trata de datos diarios / horarios / segundos.
IrishStat
3
Su explicación es bastante buena, en la práctica, aunque agregaría una pequeña advertencia. Los modelos ARIMA pueden implementarse como modelos de espacio de estado (R's arimahace esto, bajo el capó), también conocidos como modelos dinámicos lineales (DLM). Los DLM también son extensiones de la regresión (de manera diferente a los efectos mixtos), por lo que supongo que existe una relación profunda entre ARIMA y los modelos de efectos mixtos. Eso no cambia las diferencias en la práctica , que resume bien.
Wayne
1
t-1
Benjamin: Toda la idea de las estadísticas es IDENTIFICAR LA ESTRUCTURA, no asumirla.
IrishStat
Creo que una respuesta completa también podría mencionar la diferencia entre series de tiempo y datos de panel. Si entiendo correctamente, ARIMA y similares se usan principalmente para datos donde cada observación es de la misma variable a lo largo del tiempo. En el modelo multinivel para el cambio, generalmente nos centramos en los datos del panel y estamos modelando una variable medida en una variedad de individuos, grupos, países, etc., a lo largo del tiempo. ¿Derecho?
Benjamin Mako Hill
7

ARMA / ARIMA son modelos univariados que optimizan cómo usar el pasado de una serie para predecir esa serie. Se pueden aumentar estos modelos con variables de intervención identificadas empíricamente, como pulsos, cambios de nivel, pulsos estacionales y tendencias de tiempo local, PERO siguen siendo fundamentalmente no causales ya que no hay series de entrada sugeridas por el usuario. La extensión multivariada de estos modelos se llama XARMAX o, más generalmente, Modelos de función de transferencia que usan estructuras PDL / ADL en las entradas y emplean cualquier estructura ARMA / ARIMA necesaria en el resto. Estos modelos también se pueden fortalecer mediante la incorporación de entradas deterministas identificables empíricamente. Por lo tanto, ambos modelos pueden considerarse Aplicaciones a datos longitudinales (medidas repetidas). Ahora el artículo de Wikipedia sobre modelos multinivel se refiere a su aplicación a series temporales / datos longitudinales asumiendo ciertas estructuras primitivas / triviales, es decir, no analíticas como "Los modelos más simples suponen que el efecto del tiempo es lineal. Los modelos polinomiales pueden especificarse para permitir efectos cuadráticos o cúbicos del tiempo". .

Se puede extender el modelo de Función de transferencia para abarcar múltiples grupos, evolucionando así al análisis de series de tiempo de sección transversal agrupada donde la estructura apropiada (rezagos / derivaciones) se puede utilizar junto con la estructura ARIMA para formar modelos locales y un modelo general.

IrishStat
fuente
Los modelos de varios niveles también pueden usar una especificación general de tiempo que agrega variables ficticias para cada momento que capturará el efecto promedio para ese período de tiempo.
Benjamin Mako Hill
1
: Benjamin El problema con rhat es que estás asumiendo que la estacionalidad es determinista y, para colmo, que los coeficientes estacionales son invariables con el tiempo en comparación con un pulso estacional, uno de los maniquíes ISI-1 que no tuvo efecto por primera vez períodos, pero lo hizo después. Otra estructura estacional igualmente posible es el componente ARIMA estacional que utiliza una respuesta adaptativa a temporadas anteriores en comparación con la respuesta FIJA sugerida.
IrishStat