Análisis de intervención con series temporales multidimensionales.

11

Me gustaría hacer un análisis de intervención para cuantificar los resultados de una decisión política sobre las ventas de alcohol a lo largo del tiempo. Sin embargo, soy bastante nuevo en el análisis de series de tiempo, así que tengo algunas preguntas para principiantes.

Un examen de la literatura revela que otros investigadores han utilizado ARIMA para modelar las ventas de alcohol en series temporales, con variables ficticias como regresores para modelar el efecto de la intervención. Si bien esto parece un enfoque razonable, mi conjunto de datos es un poco más rico que los que he incluido en la literatura. En primer lugar, mi conjunto de datos se desagrega por tipo de bebida (es decir, cerveza, vino, licores), y luego se desglosa por zona geográfica.

Si bien podría crear análisis ARIMA por separado para cada grupo desagregado y luego comparar los resultados, sospecho que hay un mejor enfoque aquí. ¿Alguien más familiarizado con los datos de series temporales multidimensionales puede proporcionar algunos consejos o sugerencias?

fmark
fuente

Respuestas:

9

El modelo ARIMA con una variable ficticia para una intervención es un caso especial de un modelo lineal con errores ARIMA.

Puede hacer lo mismo aquí, pero con un modelo lineal más rico que incluye factores para el tipo de bebida y las zonas geográficas.

En R, el modelo puede estimarse usando arima () con las variables de regresión incluidas a través del argumento xreg. Desafortunadamente, tendrá que codificar los factores utilizando variables ficticias, pero de lo contrario es relativamente sencillo.

Rob Hyndman
fuente
6

Si desea modelar las ventas de tipos de bebidas como un vector [ventas de vino en t, ventas de cerveza en t, ventas de bebidas espirituosas en t], es posible que desee mirar los modelos de Autoregresión vectorial (VAR). Probablemente desee la variedad VARX que tiene un vector de variables exógenas como la región y el modelo de intervención política, junto con las secuencias de vino, cerveza y licores. Son bastante fáciles de ajustar y obtendría funciones de respuesta al impulso para expresar el impacto de los choques exógenos, que también podrían ser de interés. Hay una discusión exhaustiva en el libro de Lütkepohl sobre series de tiempo multivariadas.

Finalmente, ciertamente no soy economista, pero me parece que también podrías pensar en las proporciones de estos tipos de bebidas, así como en los niveles. Las personas probablemente operan bajo una restricción presupuestaria de alcohol, lo sé, lo cual acoplaría los niveles y (anti) correlacionaría los errores.

conjugadoprior
fuente
3

Cada serie de tiempo debe evaluarse por separado con la idea final de recopilar, es decir, agrupar series similares en grupos o secciones que tengan una estructura similar / común. Dado que los datos de series temporales pueden ser intervenidos por una estructura determinista desconocida en puntos no especificados en el tiempo, se recomienda hacer una Detección de intervención para encontrar dónde la intervención realmente tuvo un efecto. Si sabe que una ley entró en vigencia en un punto particular de (de jure), esto puede de hecho (de facto) no la fecha en que realmente ocurrió la intervención. Los sistemas pueden responder antes de una fecha de efecto conocida o incluso después de la fecha debido a incumplimiento o falta de respuesta. Especificar la fecha de la intervención puede conducir a un sesgo de especificación del modelo. Le sugiero que busque en Google "Detección de intervención" o "Detección de valores atípicos". Un buen libro sobre esto sería el Prof. Wei de la Universidad de Temple publicado por Addison-Wessley. Creo que el título es "Análisis de series temporales". Un comentario adicional de una Variable de intervención puede aparecer como un pulso o cambio de nivel / paso o un pulso estacional o una tendencia de hora local.

En respuesta a la expansión de la discusión sobre las tendencias de hora local:

Si tiene una serie que exhibe 1,2,3,4,5,7,9,11,13,15,16,17,18,19 ... ha habido un cambio en la tendencia en el período 5 y en 10 Para mí, una pregunta principal en las series temporales es la detección de cambios de nivel, por ejemplo, 1,2,3,4,5,8,9,10, u otro ejemplo de un cambio de nivel 1,1,1,1,2 , 2,2,2, AND / OR o la detección de rupturas de tendencia de tiempo. Así como un pulso es la diferencia de un paso, un paso es la diferencia de una tendencia. Hemos extendido la teoría de detección de intervención a la 4ta dimensión i, e, cambio de punto de tendencia. En términos de apertura, he podido implementar tales esquemas de detección de intervención en conjunción con ARIMA y los modelos de función de transferencia. Soy uno de los estadísticos senior de series temporales que ha colaborado en el desarrollo de AUTOBOX, que incorpora estas características. No conozco a nadie más que haya programado esta emocionante innovación.

IrishStat
fuente
¿Podría elaborar un poco más sobre cómo se Local Time Trendve una variable de intervención? Estoy familiarizado con los otros tres.
fmark 01 de
Además, ¿puede indicarme un paquete R que pueda hacer una detección de intervención?
fmark 01 de
1
Si tiene una serie que exhibe 1,2,3,4,5,7,9,11, ... ha habido un cambio en la tendencia en el período 5. La pregunta principal en las series de tiempo es la detección de cambios de nivel, por ejemplo 1,2,3,4,5,8,9,10, .. u otro ejemplo de un cambio de nivel 1,1,1,1,2,2,2,2, o la detección de rupturas de tendencia de tiempo.
IrishStat
¿Cómo se pueden encontrar intervenciones en una serie temporal con regresores externos? ¿Cómo se podría saber que el regresor no explica la intervención?
Frank
si se encuentra una intervención en Y DESPUÉS del impacto de X y su historia es una historia de Y ENTONCES se declara una anomalía / pulso con regresores externos.
IrishStat el