Jugué con algunas pruebas de raíz unitaria en R y no estoy completamente seguro de qué hacer con el parámetro k lag. Utilicé la prueba aumentada de Dickey Fuller y la prueba de Philipps Perron del paquete tseries . Obviamente, el parámetro predeterminado (para ) depende solo de la longitud de la serie. Si elijo diferentes valores k obtengo resultados bastante diferentes wrt. rechazando el nulo:adf.test
Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary
# 103^(1/3)=k=4
Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0
Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6
más el resultado de la prueba PP:
Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary
En cuanto a los datos, creo que los datos subyacentes no son estacionarios, pero aún así no considero que estos resultados sean una copia de seguridad sólida, en particular porque no entiendo el papel del parámetro . Si miro descomponer / stl veo que la tendencia tiene un fuerte impacto en lugar de solo una pequeña contribución del resto o la variación estacional. Mi serie es de frecuencia trimestral.
¿Alguna pista?
fuente
Respuestas:
Ha pasado un tiempo desde que miré las pruebas ADF, sin embargo, recuerdo al menos dos versiones de la prueba adf.
http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html
http://cran.r-project.org/web/packages/fUnitRoots/
El paquete fUnitRoots tiene una función llamada adfTest (). Creo que el problema de la "tendencia" se maneja de manera diferente en esos paquetes.
Editar ------ Desde la página 14 del siguiente enlace, había 4 versiones (uroot descontinuado) de la prueba adf:
http://math.uncc.edu/~zcai/FinTS.pdf
Un enlace más. Lea la sección 6.3 en el siguiente enlace. Hace un trabajo mucho mejor de lo que podría hacer al explicar el término de retraso:
http://www.yats.com/doc/cointegration-en.html
Además, tendría cuidado con cualquier modelo estacional. A menos que esté seguro de que hay algo de estacionalidad presente, evitaría usar términos estacionales. ¿Por qué? Cualquier cosa puede desglosarse en términos estacionales, incluso si no lo es. Aquí hay dos ejemplos:
El siguiente gráfico es de la declaración de la gráfica anterior (x.stl). stl () encontró un pequeño término estacional en ruido blanco. Se podría decir que el término es tan pequeño que realmente no es un problema. El problema es que, en datos reales, no sabes si ese término es un problema o no. En el ejemplo a continuación, observe que la serie de datos de tendencias tiene segmentos en los que parece una versión filtrada de los datos sin procesar, y otros segmentos en los que podría considerarse significativamente diferente de los datos en bruto.
fuente
El parámetro k es un conjunto de retrasos agregados para abordar la correlación en serie. La A en ADF significa que la prueba se aumenta mediante la adición de retrasos. La selección del número de retrasos en el ADF se puede hacer de varias maneras. Una forma común es comenzar con un gran número de retrasos seleccionados a priori y reducir el número de retrasos secuencialmente hasta que el retraso más largo sea estadísticamente significativo.
Puede probar la correlación en serie en los residuos después de aplicar los retrasos en el ADF.
fuente