Confusión con la prueba Dickey Fuller aumentada

16

Estoy trabajando en el conjunto de datos electricitydisponibles en el paquete R TSA. Mi objetivo es averiguar si un arimamodelo será apropiado para estos datos y, finalmente, ajustarlo. Así que procedí de la siguiente manera:

primero: trazar la serie de tiempo que resultó si el siguiente gráfico: ts plot1

segundo: quería tomar el registro electricitypara estabilizar la varianza y luego diferenciar la serie según corresponda, pero justo antes de hacerlo, probé la estacionariedad en el conjunto de datos original utilizando la adfprueba (Aumento de Dickey Fuller) y, sorprendentemente, resultó de la siguiente manera:

Código y resultados:

adf.test(electricity)

             Augmented Dickey-Fuller Test
data:  electricity 
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value

Bueno, según la noción de serie temporal de mi principiante, supongo que significa que los datos son estacionarios (valor p pequeño, rechazan la hipótesis nula de no estacionariedad). Pero mirando la trama ts, no encuentro forma de que esto pueda ser estacionario. ¿Alguien tiene una explicación válida para esto?

Vara
fuente
55
El ADF solo prueba la raíz unitaria estacionaria, esto podría ser estacionario de tendencia. Por lo tanto, debe usar la prueba KPSS, consulte stats.stackexchange.com/questions/30569/… En general, hay una diferencia entre los modelos DS (diferencia estacionaria) y TS (tendencia estacionaria). KPSS es la mejor prueba para distinguir entre esos modelos, vea el enlace para más detalles.
Stat Tistician
3
Parece que la serie tiene temporadas y tendencia. Integre en la prueba ADF una tendencia determinista + dummies estacionales y ejecute la prueba. Verifique también si hay residuos autocorrelacionados.
Pantera

Respuestas:

12

adf.testXt-Xt-1

> adf.test(electricity, k=12)

Augmented Dickey-Fuller Test
data:  electricity
Dickey-Fuller = -1.9414, Lag order = 12, p-value = 0.602
alternative hypothesis: stationary
horaceT
fuente
2

Suponiendo que "adf.test" realmente proviene del paquete "tseries" (directa o indirectamente), la razón sería que incluye automáticamente una tendencia de tiempo lineal. Del documento tseries (versión 0.10-35): "Se utiliza la ecuación de regresión general que incorpora una tendencia constante y lineal" [...] Por lo tanto, el resultado de la prueba indica la estacionariedad de la tendencia (que a pesar del nombre no es estacionaria).

También estoy de acuerdo con Pantera en que los efectos estacionales podrían distorsionar el resultado. En realidad, la serie podría ser una tendencia temporal + estacionales deterministas + proceso raíz de unidad estocástica, pero la prueba ADF podría interpretar erróneamente las fluctuaciones estacionales como reversiones estocásticas a la tendencia determinista, lo que implicaría raíces más pequeñas que la unidad. (Por otro lado, dado que ha incluido suficientes retrasos, esto debería aparecer como raíces unitarias (espurias) en frecuencias estacionales, no en la frecuencia cero / a largo plazo que la prueba ADF considera. En cualquier caso, dada la patrón estacional es mejor incluir las estacionales).

Sven S.
fuente