¿Los modelos MA no invertibles implican que el efecto de las observaciones pasadas aumenta con la distancia?

8

Actualización (2019-06-25): cambio de título de "¿ Tienen sentido los modelos MA no invertibles?" para distinguirlo de la pregunta 333802 .

Mientras revisa MA (q) modelos, me encontré con estas diapositivas (Alonso y García-Martos, 2012). Los autores afirman que, si bien todos los procesos de MA son estacionarios, si no son invertibles, usted tiene

" La situación paradójica en la que el efecto de las observaciones pasadas aumenta con la distancia " .

Esto se puede ver en la descomposición del proceso MA (1):

yt=ϵtθϵt1
dentro
yt=ϵti=1t1θiytiθtϵ0,
donde claramente |θ|>1se traduce en historia teniendo más y más influencia sobre el presente. Dos cosas sobre esto me molestan:

  1. No es difícil imaginar una situación en la que haya un período de retraso único en los efectos de algo
  2. Esta publicación validada cruzada tiene una respuesta que afirma:

"La invertibilidad no es realmente un gran problema porque casi cualquier modelo MA (q) no invertible gaussiano puede cambiarse a un modelo MA (q) invertible que represente el mismo proceso "

¿Es cierto que el efecto de las observaciones pasadas aumenta con la distancia? Si es así, ¿eso hace que los modelos no sean aptos para describir fenómenos del mundo real?

Actualización (2019-11-09) Encontré esto en el texto Análisis de series temporales y sus aplicaciones (Shumway y Stoffer, página 85) que también respalda el caso de que realmente no importa si un modelo de MA es no invertible, pero nosotros Es posible que desee elegir la versión no invertible del modelo por conveniencia. Análisis de series temporales y sus aplicaciones Página 85

Ben Ogorek
fuente
1
Creo que una distinción entre |θ|=1 y |θ|>1puede ser importante Su texto parece centrarse en el último caso, pero la terminología ( no reversible ) no ayuda a distinguir entre los dos. Si|θ|=1 es un gran problema (¿no es así?) mientras |θ|>1no es así, la pregunta es difícil de responder cuando se basa únicamente en el término no reversible . ¿Quizás podrías editar la publicación para resaltar esto?
Richard Hardy
@whuber, agradecería otra mirada desde que cambié el título. Espero que al centrarme en la propiedad de influencia de los puntos de datos históricos, he forjado un nuevo espacio.
Ben Ogorek

Respuestas:

5

No es un gran problema: es muy estacionario y se acerca al ruido blanco

Lo no invertible MA(1)el proceso tiene mucho sentido y no exhibe ningún comportamiento particularmente extraño. Tomando la versión gaussiana del proceso, para cualquier vectory=(y1,...,yn) consistente en observaciones consecutivas, tenemos yN(0,Σ) con covarianza:

Σσ21+θ2[1+θ2θ0000θ1+θ2θ0000θ1+θ20000001+θ2θ0000θ1+θ2θ0000θ1+θ2].

Como puede ver, este es un proceso fuertemente estacionario, y las observaciones que están a más de un retraso son independientes, incluso cuando |θ|>1. Esto no es sorprendente, en vista del hecho de que tales observaciones no comparten ninguna influencia del proceso de ruido blanco subyacente. No parece haber ningún comportamiento en el que "las observaciones pasadas aumenten con la distancia", y la ecuación que usted ha establecido no establece esto (ver más abajo para una discusión más detallada).

De hecho, como |θ|(que es el caso más extremo del fenómeno que está considerando) el modelo se reduce asintóticamente a un proceso trivial de ruido blanco. Esto es completamente sorprendente, en vista del hecho de que un coeficiente grande en el primer término de error rezagado domina el coeficiente unitario en el término de error concurrente, y desplaza el modelo asintóticamente hacia la formaytθϵt1, que es solo una versión escalada y modificada del proceso de ruido blanco subyacente.


Una nota sobre su ecuación: en la ecuación de su pregunta, escribe el valor actual de la serie de tiempo observable como una suma geométrica creciente de valores pasados, más los términos de error restantes. Esto se afirma para mostrar que "el efecto de las observaciones pasadas aumenta con la distancia". Sin embargo, la ecuación implica una gran cantidad de términos de cancelación. Para ver esto, expandamos los términos observables pasados ​​para mostrar la cancelación de términos:

yt=ϵti=1t1θiytiθtϵ0=ϵti=1t1θi(ϵtiθϵti1)θtϵ0=ϵt(θϵt1θ2ϵt2)   (θ2ϵt2θ3ϵt3)(θ3ϵt3θ4ϵt4)       (θt1ϵ1θtϵ0).

We can see from this expansion that the geometrically increasing sum of past values of the observable time series is there solely to get the previous error term:

ϵt1=i=1t1θi1yti+θt1ϵ0.

All that is happening here is that you are trying to express the previous error term in an awkward way. The fact that a long cancelling sum of geometrically weighted values of the series is equal to the desired error term does not demonstrate that past observations are having "an effect" on the present time-series value. It merely means that if you want to express ϵt1 in terms of ϵ0 then the only way you can do it is to add in the geometrically weighted sum of the observable series.

Ben - Reinstate Monica
fuente
1
Hi Ben: I agree with what you did but the reason for the non-inveribility is that, if you re-write as an AR(1), the model response depends more on the data that's further away from the response compared to data that's closer. This is not intuitive for an AR(1). But, in general, from a practical perspective, I agree about MA non-invertibility not being important. thanks.
mlofton
Ben, if you could explain why the second equation in the original post does not mean what I think it does (that the influence of past observations on the moving average increases over time), then I'd be satisfied with the answer. Everything else you're saying makes sense.
Ben Ogorek
@Ben Ogorek: I have added an additional section addressing this equation.
Ben - Reinstate Monica
Does your answer apply equally to the cases of |θ|=1 and |θ|>1? I am thinking of overdifferencing which yields θ=1. If I remember correctly, it is considered a rather serious problem (though I cannot recall the exact argument).
Richard Hardy
1
Alright, Ben, I'm convinced. I still don't feel 100% great about the previous error term explanation, but I realized you must be right after trying some simple simulations and not seeing anything strange in the dependence structure. By the way, the bounty disappeared into thin air, I think when the question got closed for duplicate status, so I skimmed some of your old answers and made up for it there.
Ben Ogorek
5

I don't think it makes sense to ask for an example "from the real world where they [non-invertible MA models] occur". All you observe is y1,y2,,yn. As I try to explain in the post you link to, the joint distribution of these data can almost always (except in the case were the MA polynomial has one or more unit roots) be identically modelled as generated by either a number of non-invertible MA models or by a corresponding invertible MA model. Based on the data alone, there is therefore no way of knowing if the "real world" underlying mechanism corresponds to that of a non-invertible or invertible model. And ARIMA models are anyhow not intended as mechanistic models of the data-generating process in the first place.

So this just boils down to restricting the parameter space to that of invertible models to make the model identifiable with the added benefit of having a model that is easily put into AR() form.

Jarle Tufto
fuente
I see what you're saying in that these are not structural models; they do not attempt to explain the world in any explicit way. The phrase "makes sense" is also not very precise. Perhaps I could rephrase as: "do non-invertible MA processes exist (in the mathematical sense)?" and "if so, does the data generating process resemble anything found in nature?" What I'm worried about is there's a artificial property, something akin to getting younger as you age, encapsulated by the second equation above.
Ben Ogorek
@BenOgorek I think any process in nature that mechanistically involve a moving average could easily correspond to a non-invertible model. A toy example is yt=ϵt+3ϵt1+ϵt2 which has roots Mod(polyroot(c(1,3,1))).
Jarle Tufto
Hi Ben: The concept of inverting ( that I'm familiar with ) is to see whether the MA can be written as an equivalent AR(). In the equation that the OP wrote, if the yti are kept and not converted to epsilons, then the equation shows that, for abs(θ)>=1, the yti further in the past have a greater effect on the current response yt, than the closer yti. In books I have read, they normally say that this type of equation has no meaning and it is basically disregarded.
mlofton
Ben: Note that I am not claiming that there's anything wrong with an MA(1) with abs(θ)>1.0. In practice, as long as one is not interested in the AR equivalent, then the model should not be problematic. It's more of a theory issue, I think.
mlofton