Estoy tratando de descubrir cómo R calcula la autocorrelación de lag-k (aparentemente, es la misma fórmula utilizada por Minitab y SAS), para poder compararla con el uso de la función CORREL de Excel aplicada a la serie y su versión k-lag. R y Excel (usando CORREL) dan valores de autocorrelación ligeramente diferentes.
También me interesaría saber si un cálculo es más correcto que el otro.
r
sas
autocorrelation
excel
Galit Shmueli
fuente
fuente
R
La fórmula de 'se analiza y explica más a fondo en stats.stackexchange.com/questions/81754/… .Respuestas:
La ecuación exacta se da en: Venables, WN y Ripley, BD (2002) Modern Applied Statistics con S. Cuarta edición. Springer-Verlag. Te daré un ejemplo:
Y así sucesivamente (por ejemplo,
res[1:47]
yres[4:50]
para el retraso 3).fuente
La forma ingenua de calcular la correlación automática (y posiblemente lo que usa Excel) es crear 2 copias del vector y luego eliminar los primeros n elementos de la primera copia y los últimos n elementos de la segunda copia (donde n es el retraso que usted están computando desde). Luego pase esos 2 vectores a la función para calcular la correlación. Este método está bien y dará una respuesta razonable, pero ignora el hecho de que los 2 vectores que se comparan son realmente medidas de la misma cosa.
La versión mejorada (como lo muestra Wolfgang) es una función similar a la correlación regular, excepto que usa todo el vector para calcular la media y la varianza.
fuente