Comprender el retraso de k en la prueba Dickey Fuller aumentada de R

15

Jugué con algunas pruebas de raíz unitaria en R y no estoy completamente seguro de qué hacer con el parámetro k lag. Utilicé la prueba aumentada de Dickey Fuller y la prueba de Philipps Perron del paquete tseries . Obviamente, el parámetro predeterminado (para ) depende solo de la longitud de la serie. Si elijo diferentes valores obtengo resultados bastante diferentes wrt. rechazando el nulo: $k$ adf.test $k$

Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary 
# 103^(1/3)=k=4 


Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0

Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6

más el resultado de la prueba PP:

Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary

En cuanto a los datos, creo que los datos subyacentes no son estacionarios, pero aún así no considero que estos resultados sean una copia de seguridad sólida, en particular porque no entiendo el papel del parámetro . Si miro descomponer / stl veo que la tendencia tiene un fuerte impacto en lugar de solo una pequeña contribución del resto o la variación estacional. Mi serie es de frecuencia trimestral. $k$

¿Alguna pista?

r time-series trend hans0l0
fuente

3

Este libro debe responder a todas sus preguntas.

mpiktas

1

¡Gracias! Me encanta la serie Springer useR, pero no conocía esta ...

hans0l0

hmm, solo pruebo si phi = 1, no si phi> 1. Pero aun así, la salida R dice que la alternativa es: estacionariedad. Entonces, ¿también verifican phi> 1? Obviamente, eso también sería no estacionario.

hans0l0

5

Ha pasado un tiempo desde que miré las pruebas ADF, sin embargo, recuerdo al menos dos versiones de la prueba adf.

http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html

http://cran.r-project.org/web/packages/fUnitRoots/

El paquete fUnitRoots tiene una función llamada adfTest (). Creo que el problema de la "tendencia" se maneja de manera diferente en esos paquetes.

Editar ------ Desde la página 14 del siguiente enlace, había 4 versiones (uroot descontinuado) de la prueba adf:

http://math.uncc.edu/~zcai/FinTS.pdf

Un enlace más. Lea la sección 6.3 en el siguiente enlace. Hace un trabajo mucho mejor de lo que podría hacer al explicar el término de retraso:

http://www.yats.com/doc/cointegration-en.html

Además, tendría cuidado con cualquier modelo estacional. A menos que esté seguro de que hay algo de estacionalidad presente, evitaría usar términos estacionales. ¿Por qué? Cualquier cosa puede desglosarse en términos estacionales, incluso si no lo es. Aquí hay dos ejemplos:

#First example: White noise
x <- rnorm(200)

#Use stl() to separate the trend and seasonal term
x.ts <- ts(x, freq=4) 
x.stl <- stl(x.ts, s.window = "periodic")
plot(x.stl)

#Use decompose() to separate the trend and seasonal term
x.dec <- decompose(x.ts)
plot(x.dec)

#===========================================

#Second example, MA process
x1 <- cumsum(x)

#Use stl() to separate the trend and seasonal term
x1.ts <- ts(x1, freq=4)
x1.stl <- stl(x1.ts, s.window = "periodic")
plot(x1.stl)

#Use decompose() to separate the trend and seasonal term
x1.dec <- decompose(x1.ts)
plot(x1.dec)

El siguiente gráfico es de la declaración de la gráfica anterior (x.stl). stl () encontró un pequeño término estacional en ruido blanco. Se podría decir que el término es tan pequeño que realmente no es un problema. El problema es que, en datos reales, no sabes si ese término es un problema o no. En el ejemplo a continuación, observe que la serie de datos de tendencias tiene segmentos en los que parece una versión filtrada de los datos sin procesar, y otros segmentos en los que podría considerarse significativamente diferente de los datos en bruto.

ingrese la descripción de la imagen aquí

bill_080
fuente

1

El parámetro k es un conjunto de retrasos agregados para abordar la correlación en serie. La A en ADF significa que la prueba se aumenta mediante la adición de retrasos. La selección del número de retrasos en el ADF se puede hacer de varias maneras. Una forma común es comenzar con un gran número de retrasos seleccionados a priori y reducir el número de retrasos secuencialmente hasta que el retraso más largo sea estadísticamente significativo.

Puede probar la correlación en serie en los residuos después de aplicar los retrasos en el ADF.

RAH
fuente

Comprender el retraso de k en la prueba Dickey Fuller aumentada de R

Respuestas: