¿Hay alguna manera de permitir la estacionalidad en los coeficientes de regresión?

8

Digamos que tengo una serie temporal, G _t , y una covariable B _t . Quiero encontrar la relación entre ellos por el modelo ARMA:

G _t = Z _t + β ₀ + β ₁ B _t

donde el Z _t residual sigue algún proceso ARMA.

El problema es: sé con certeza que β ₀ y β ₁ varían según la época del año. Sin embargo, no quiero ajustar un modelo separado para cada mes porque eso introduce discontinuidad en mi serie temporal, lo que significa que no puedo calcular la función de autocorrelación de los residuos finales.

Entonces, ¿hay un modelo de serie temporal (o familia de modelos, me pregunto) que permita que los coeficientes de correlación de sus covariables cambien estacionalmente?

========================

Editar: Gracias por los que respondieron aquí. Decidí usar muñecos de temporada, pero me puse a trabajar, así que no respondí a tiempo.

time-series correlation econometrics arima time-varying-covariate eddieisnutty
fuente

No, esta no es una pregunta tonta, cuando quiere decir "cambiar la estacionalidad", ¿quiere decir que la estacionalidad cambia con el tiempo y no es constante? Si ese es el caso, necesita un modelo que maneje la estacionalidad estocástica, la codificación ficticia no funcionará, ya que solo maneja la estacionalidad determinista. Ver mi pregunta anterior . Simplemente como ARIMA (p, d, q) (P, D, Q), esto debería hacerlo.

Z_{t}

$Z_t$

pronosticador

6

Editar (La misma idea fue propuesta por Stephan Kolassa unos minutos antes de que publicara mi respuesta. La respuesta a continuación puede darle algunos detalles relevantes).

Podrías usar muñecos estacionales. Para simplificar, ilustro esto para una serie trimestral. Los dummies estacionales son variables indicadoras para cada temporada. El -ésimo muñeco estacional toma el valor 1 para aquellas observaciones relacionadas con la temporada y 0 de lo contrario. Para una serie trimestral, los dummies estacionales, , se definen de la siguiente manera: $i$ $i$ $SD$

\begin{array}{rcl} S re = [\begin{array}{cccc} 1 & 0 0 & 0 0 & 0 0 \\ 0 0 & 1 & 0 0 & 0 0 \\ 0 0 & 0 0 & 1 & 0 0 \\ 0 0 & 0 0 & 0 0 & 1 \\ 1 & 0 0 & 0 0 & 0 0 \\ ⋮ & ⋮ & ⋮ & ⋮ \\ 1 & 0 0 & 0 0 & 0 0 \\ 0 0 & 1 & 0 0 & 0 0 \\ 0 0 & 0 0 & 1 & 0 0 \\ 0 0 & 0 0 & 0 0 & 1 \end{array}] S re si = [\begin{array}{cccc} {si}_{1} & 0 0 & 0 0 & 0 0 \\ 0 0 & {si}_{2} & 0 0 & 0 0 \\ 0 0 & 0 0 & {si}_{3} & 0 0 \\ 0 0 & 0 0 & 0 0 & {si}_{4 4} \\ {si}_{5 5} & 0 0 & 0 0 & 0 0 \\ ⋮ & ⋮ & ⋮ & ⋮ \\ {si}_{norte - 3} & 0 0 & 0 0 & 0 0 \\ 0 0 & {si}_{norte - 2} & 0 0 & 0 0 \\ 0 0 & 0 0 & {si}_{norte - 1} & 0 0 \\ 0 0 & 0 0 & 0 0 & {si}_{norte} \end{array}] \end{array}

$\begin{eqnarray} SD = \left[ \begin{array}{cccc} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 1 & 0 & 0 & 0 \\ \vdots & \vdots & \vdots & \vdots \\ 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ \end{array} \right] \quad SDB = \left[ \begin{array}{cccc} B_{1} & 0 & 0 & 0 \\ 0 & B_{2} & 0 & 0 \\ 0 & 0 & B_{3} & 0 \\ 0 & 0 & 0 & B_{4} \\ B_{5} & 0 & 0 & 0 \\ \vdots & \vdots & \vdots & \vdots \\ B_{n-3} & 0 & 0 & 0 \\ 0 & B_{n-2} & 0 & 0 \\ 0 & 0 & B_{n-1} & 0 \\ 0 & 0 & 0 & B_{n} \\ \end{array} \right] \end{eqnarray}$

Puede multiplicar cada columna en por su variable explicativa y obtener la matriz definida anteriormente. $SD$ $B_t$ $SDB$

Luego, puede especificar su modelo de la siguiente manera:

{sol}_{t} = Z_{t} + β_{0 0, s} S {re}_{t} + β_{1, s} S re {si}_{t},

$G_t = Z_t + \beta_{0,s} SD_t + \beta_{1,s} SDB_t \,,$

donde el índice indica la temporada. Observe que ahora tenemos cuatro coeficientes (12 en su serie mensual) , uno para cada columna en . $s$ $\beta_{1,s}$ $SDB$

Lo mismo para la intercepción excepto que debemos eliminar una columna en para evitar una colinealidad perfecta. En una serie mensual incluiría, por ejemplo, las primeras 11 intercepciones estacionales en . $\beta_0$ $SD$ $SD$

Ajustar el modelo, por ejemplo, por la máxima probabilidad le dará una estimación de coeficiente para cada temporada. También puede probar si son iguales para todos los o de manera similar si son constantes en todas las estaciones. $\beta_{0,s}$ $s$ $\beta_{1,s}$

javlacalle
fuente

1

+1. Aunque no desea encajar usando Mínimos cuadrados ordinarios si tiene errores ARMA.

Stephan Kolassa

1

@javlacalle +1, ¿podemos simplemente usar como ARIMA (p, d, q) (P, D, Q) en lugar de tontos estacionales para capturar la estacionalidad? De esa manera, también tiene en cuenta la estacionalidad estocástica además de la estacionalidad determinista. Si bien esto no aborda la pregunta OP sobre la estacionalidad como coeficientes de regresión, podría valer la pena resaltar la diferencia.

Z_{t}

$Z_t$

pronosticador

1

@forecaster Creo que la búsqueda del OP es medir la influencia de en en diferentes estaciones. Esto podría capturarse permitiendo coeficientes que varían estacionalmente, . Si es constante para todas las estaciones, entonces no podemos medir el efecto de en cada temporada y probar si las diferencias son significativas. Además, si es fijo, observar la estacionalidad en los residuos podría significar que hay un efecto estacional no capturado por un solo coeficiente , en lugar de la necesidad de extender el modelo para por medio de un modelo ARIMA estacional.

B_{t}

$B_t$

G_{t}

$G_t$

β_{s, 1}

$\beta_{s,1}$

β_{1}

$\beta_1$

B_{t}

$B_t$

β_{1}

$\beta_1$

β_{1}

$\beta_1$

Z_{t}

$Z_t$

javlacalle

1

@Frank La intercepción se establece en cero para la temporada que queda fuera. Los coeficientes de las intersecciones relacionadas con los coeficientes restantes se interpretan como un cambio con respecto al valor promedio de la temporada eliminada (que no es necesariamente cero, sino el valor determinado por los coeficientes y valores de las variables restantes en esa temporada).

javlacalle

1

@Frank Si se usan 11 columnas en , entonces, en principio, incluiría una constante (una columna de unos); de lo contrario, los residuos pueden no ser cero en promedio: . En la duodécima temporada (la que quedó fuera), el valor esperado de es . Los coeficientes , se interpretan como cambios con respecto a la estimación de .

S D B

$SDB$

α

$\alpha$

G_{t} = α + Z_{t} + β_{0, s} S D_{t} + β_{1, s} S D B_{t}

$G_t = \alpha + Z_t + \beta_{0,s} SD_t + \beta_{1,s} SDB_t$

G_{t}

$G_t$

α + β_{1, 12} S D B_{t}

$\alpha+\beta_{1,12}SDB_t$

β_{0, s}

$\beta_{0,s}$

s = 1, \dots, 11

$s=1,\dots,11$

α

$\alpha$

javlacalle

5

Ciertamente lo hay. Simplemente incluya dummies mensuales en una interacción con . Supongamos que denota un valor ficticio que es 1 si el tiempo corresponde al mes 0 en caso contrario. Luego ajuste la siguiente regresión con errores ARMA: $B_t$ $M_{tm}$ $t$ $m$

G_{t} = β M_{t \cdot} + γ B_{t} M_{t \cdot} + Z_{t}

$G_t = \beta M_{t\cdot} + \gamma B_tM_{t\cdot} + Z_t$

donde es ARMA (p, q) y y son vectores de parámetros de longitud 12. $Z_t$ $\beta$ $\gamma$

Puede hacer el ajuste real usando R con el nlmepaquete, usando la gls()función y especificando una corARMA()estructura de correlación .

Stephan Kolassa
fuente

¿Qué sucede si no tiene muchos puntos de datos y desea preservar los parámetros? ¿Hay alguna manera de restar una temporada manteniendo los parámetros al mínimo?

Frank

1

@Frank: si tenemos muy pocos datos para admitir un modelo complejo, personalmente consideraría la regularización, como el lazo, la red elástica o los enfoques bayesianos.

Stephan Kolassa

Gracias por responder a una pregunta tan antigua. ¿Puedo preguntar si debería

β M_{t}

$\beta M_t$ y

γ B_{t} M_{t}

$\gamma B_t M_t$ cada uno tiene 12 términos? O deberia

β M_{t}

$\beta M_t$ tiene 11 términos? Aprendí sobre "la trampa de variable ficticia", pero no puedo encontrar una referencia que discuta claramente este caso. Por ejemplo, ¿funcionaría este modelo? ¿O necesito disminuir la duración de

β

$\beta$ vector por 1?

Y_{t} = β M_{t} + γ B_{t} M_{t} + f (t) + Z_{t}

$Y_t = \beta M_t + \gamma B_t M_t + f(t) + Z_t$

Frank

1

@Frank: sí, ambos deberían tener 12 términos ya que no hay intercepción . Si elimina un término, diga

β_{1}

$\beta_1$ , eso significa que la media en mes

1

$1$ para

B_{t} = 0

$B_t=0$ debería ser cero, lo que generalmente no tendrá sentido. Alternativamente, podría incluir una intercepción y un término para

B_{t}

$B_t$ como efecto principal (sin interacción con

M

$M$ ), luego deje una entrada de ambas

β

$\beta$ y

γ

$\gamma$ - que te daría

1 + 1 + 11 + 11 = 24

$1+1+11+11=24$ parámetros, exactamente tantos como el modelo que propongo. Es solo una reparametrización. El modelo que propone en su comentario funciona (suponiendo que sea determinista

f

$f$ )

Stephan Kolassa

1

Deberían estarlo, sí

Stephan Kolassa

4

Si no desea discretizar el efecto estacional, podría suponer que los coeficientes de regresión varían de manera cíclica en función de la época del año, es decir $\beta_0(t) = w_0 + w_1\sin nt + w_2\cos nt$ y $\beta_1(t) = w_3 + w_4\sin nt + w_5\cos nt$ , entonces si los sustituye en su modelo lineal, debería obtener algo de la forma

$G_t = Z_t + w_o + w_1\sin nt + w_2\cos nt + w_3B_t + w_4B_t\sin nt + w_5B_t\cos nt$

Puede ajustar este modelo utilizando la regresión OLS (o cualquier método que ya esté utilizando) con las covariables adicionales $\sin nt$ , $\cos nt$ , $B_t\sin nt$ y $B_t\cos nt$ , dónde $n$ es la constante que necesitas para representar un año ( $2\pi/365$ para una serie de tiempo diaria).

Esto no introduciría ninguna discontinuidad en el modelo ya que la estacionalidad en los coeficientes de regresión son funciones suaves del tiempo. Sospecho que si agrega componentes seno y coseno que representan armónicos del ciclo anual, podría modelar las desviaciones de la variación sinusoidal simple en los coeficientes de regresión (enfoque de tipo serie de Fourier).

Advertencia: Ha sido un día largo, por lo que puede haber cometido un error estúpido en alguna parte.

Dikran Marsupial
fuente

(+1) Un enfoque trigonométrico es una alternativa interesante. Otro atractivo del enfoque trigonométrico es que puede requerir menos parámetros. Su ecuación usa 6 parámetros contra 11 + 12 = 23 en el enfoque que discutí en mi respuesta. En la práctica, probablemente tendríamos que incluir además de la frecuencia estacional fundamental (

2 π / 12

$2\pi/12$ en una serie mensual) algunos de sus armónicos, que requerirán más parámetros. Pero podemos obtener un ajuste razonable sin incluir todos los armónicos y, por lo tanto, se puede reducir el número de parámetros a estimar.

javlacalle

Una desventaja que veo es que la interpretación es menos directa en el contexto de un modelo de regresión. La interpretación de los maniquíes estacionales 0-1 se puede hacer en términos de meses en lugar de ciclos de periodicidad estacional. Podemos concluir, por ejemplo, que el efecto de la temperatura en las ventas de un determinado producto es el más alto en agosto y no tiene un efecto importante en marzo. En el enfoque trigonométrico, concluiríamos, por ejemplo, que el efecto de la temperatura en las ventas sigue un ciclo que se repite cada 6 meses. La interpretación anterior puede ser más informativa.

javlacalle

Aún podría hacerlo con este enfoque, podría trazar la variación en cada

β_{0}

$\beta_0$ y

β_{1}

$\beta_1$ por una suma ponderada de los componentes seno y coseno, y podría discretizar para ver cómo varían las ventas por mes. La pregunta original sugería que no se deseaban discontinuidades, lo que implica una variación suave. Al final del día, el enfoque correcto depende de qué es lo que está tratando de descubrir.

Dikran Marsupial

1

Según tengo entendido, la preocupación de la OP era con las discontinuidades en los residuos, el ajuste de 12 modelos de regresión (uno para cada mes) conducirá a 12 series de residuos en lugar de una serie de residuos donde realizar algunos diagnósticos mirando sus autocorrelaciones. Tanto los maniquíes 0-1 como los maniquíes trigonométricos serían una forma apropiada de abordar este problema. Cuál es un enfoque más natural dependerá, como usted dice, del propósito del análisis y del tipo de información que se desea.

javlacalle

Subrayemos que la pregunta es general y solo la etiqueta econometricsrevela el interés del OP en ese lado. Para los datos de series temporales ambientales, el enfoque trigonométrico suele ser muy exitoso y natural, mientras que, por el contrario, los meses tienen poco o ningún significado, incluso si los datos se informan de esa manera.

Nick Cox

2

Ajuste la media y los armónicos del ciclo estacional a las series temporales de x e y. Estos proporcionan los términos de intercepción. Luego, restarlos de x e y para crear anomalías. Use estas anomalías x 'e y' para calcular los coeficientes de pendiente de regresión que varían estacionalmente: ajuste el producto de matriz entre x 'e y' con los armónicos medios y principales al ciclo estacional. Haga lo mismo para la varianza de la x '. Luego divida el ajuste del ciclo estacional a la covarianza por el ajuste del ciclo estacional a la varianza para proporcionar coeficientes de pendiente en constante evolución. Para más detalles, consulte http://onlinelibrary.wiley.com/doi/10.1002/qj.3054/full

Paul Roundy
fuente

¿Hay alguna manera de permitir la estacionalidad en los coeficientes de regresión?

Respuestas: