Series temporales biológicas multivariantes: VAR y estacionalidad

15

Tengo un conjunto de datos de series temporales multivariadas que incluye variables biológicas y ambientales que interactúan (más posiblemente algunas variables exógenas). Además de la estacionalidad, no hay una tendencia clara a largo plazo en los datos. Mi propósito es ver qué variables están relacionadas entre sí. La previsión no se busca realmente.

Al ser nuevo en el análisis de series de tiempo, leí varias referencias. Por lo que entiendo, el modelo Vector Autoregresivo (VAR) sería apropiado, pero no me siento cómodo con la estacionalidad y la mayoría de los ejemplos que encontré se referían al campo de la economía (tan a menudo con el análisis de series de tiempo ...) sin estacionalidad.

¿Qué debo hacer con mis datos estacionales? Pensé en desestacionalizarlos; por ejemplo, en R, usaría decomposey luego usaría los $trend + $randvalores para obtener una señal que parezca bastante estacionaria (según lo juzgado acf). Los resultados del modelo VAR me confunden (se selecciona un modelo de 1 rezago mientras que intuitivamente hubiera esperado más, y solo los coeficientes para la autorregresión, y no para la regresión con otras variables rezagadas, son significativos). ¿Estoy haciendo algo mal, o debería concluir que mis variables no están (linealmente) relacionadas / mi modelo no es el bueno (pregunta subsidiaria: ¿hay un equivalente no lineal a VAR?).

[Alternativamente, leí que probablemente podría usar variables estacionales ficticias, aunque no puedo entender exactamente cómo implementarlo].

Las sugerencias paso a paso serían muy apreciadas, ya que los detalles para usuarios experimentados podrían ser realmente informativos para mí (y los fragmentos de código R o enlaces a ejemplos concretos son muy bienvenidos, por supuesto).

ztl
fuente
2
Mucho depende de cómo pienses sobre la estacionalidad. Mi lectura desigual de la literatura indica que los economistas a menudo consideran la estacionalidad como una molestia poco interesante, mientras que los científicos ambientales a menudo se sienten mucho más positivos al respecto. El método de las variables ficticias tal como se usa en economía depende, con frecuencia, de que los datos sean trimestrales o mensuales y que los efectos de las vacaciones (en todos los sentidos) sean a veces espinosos; Con los datos ambientales, a veces puede funcionar bien con algunos términos de Fourier (sinusoidales) y no es necesario recurrir a tontos.
Nick Cox
2
Gracias, @Nick Cox. Los términos de Fourier no parecen ser una solución en mi caso particular, donde las variables muestran un patrón estacional más complicado que las señales sinusoidales (a menos que use varios armónicos, pero este no es el objetivo aquí). Y a pesar de que la estacionalidad claramente no es un término molesto poco interesante en mi caso, estaba buscando algo que me ayudara a explicar la variabilidad adicional en los datos más allá de la estacionalidad (es decir, la tendencia a más largo plazo) en función de otras variables.
ztl
44
¿Qué pasa con un modelo ARMA multivariante? Es similar a VAR, pero si lo entiendo correctamente, permite una interacción más dinámica entre las variables. Alguien más puede confirmar / rechazar mi sospecha.
rbatt

Respuestas:

1

Sé que esta pregunta es bastante antigua, pero quedó sin respuesta. Quizás la pregunta principal no es cómo eliminar el ciclo estacional en los datos, pero es parte de él, así que lo intentaré: para eliminar la estacionalidad de un conjunto de datos, existen varios métodos, desde simples promedios agregados mensualmente hasta ajustando una función sinusoidal (u otra armónica apropiada) con métodos de ajuste no lineales como Nelder-Mead.

La forma más fácil es promediar los datos que pertenecen a todos los enero, a todos los febrero, etc., es decir, crea un ciclo anual compuesto, que luego puede restar de sus datos.

nukimov
fuente