¿Qué muestra el gráfico de autocorrelación (pandas)?

12

Soy un principiante y estoy tratando de entender lo que muestra un gráfico de autocorrelación.

He leído varias explicaciones de diferentes fuentes, como esta página o la página de Wikipedia relacionada, entre otras, que no estoy citando aquí.

Tengo este código muy simple, donde tengo fechas en mi índice durante un año y los valores simplemente se incrementan de 0 a 365 para cada índice ... ( 1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365)

import numpy as np
import pandas as pd
from pandas.plotting import autocorrelation_plot
import matplotlib.pyplot as plt

dr = pd.date_range(start='1984-01-01', end='1984-12-31')

df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"])
autocorrelation_plot(df)
plt.show()

donde estará el gráfico impreso

ingrese la descripción de la imagen aquí

Puedo entender y ver por qué el gráfico comienza 1.00desde:

La autocorrelación con retraso cero siempre es igual a 1, porque esto representa la autocorrelación entre cada término y sí mismo. El valor y el valor con retraso cero siempre serán los mismos.

Esto es bueno, pero ¿por qué esta gráfica en el retraso 50 tiene un valor de alrededor de 0.65 por ejemplo? ¿Y por qué cae por debajo de 0? Si no hubiera mostrado el código que tengo, ¿sería posible deducir que este gráfico de autocorrelación muestra una serie temporal de valores crecientes? Si es así, ¿puedes tratar de explicarle a un principiante cómo puedes deducirlo?

Koray Tugay
fuente

Respuestas:

12

h

γ^(h)=1nt=1nh(xt+hx¯)(xtx¯)

La idea es que, para cada retraso , revisemos la serie y verifiquemos si el punto de datos tiempo se aleja de los covarios positiva o negativamente (es decir, cuando supera la media de la serie, también sube o baja ?)hhtt+h

Su serie es una serie monotónicamente creciente y tiene una media de . Veamos qué sucede cuando .183h=130

Primero, tenga en cuenta que solo podemos calcular la función de autocovarianza hasta el punto de tiempo 234, ya que cuando , .t=234t+h=365

t=1t=53t+h

t=54t=182

t=183t=234tt+h

¿Ves cómo esto resultaría en un promedio de correlación debido a las contribuciones aproximadamente iguales a la función de autocovarianza de los puntos de covariación positiva y los puntos de covariación negativa?

Puede notar que hay más puntos que son covariadores negativos que puntos que covarian positivamente. Sin embargo, intuitivamente, los puntos covariadores positivos son de mayor magnitud (ya que están más lejos de la media), mientras que los puntos covariadores negativos contribuyen con una magnitud menor a la función de autocovarianza, ya que surgen más cerca de la media. Por lo tanto, esto da como resultado una función de autocovarianza de aproximadamente cero.

Kevin Li
fuente