Estoy tratando de descubrir cómo R calcula la autocorrelación de lag-k (aparentemente, es la misma fórmula utilizada por Minitab y SAS), para poder compararla con el uso de la función CORREL de Excel aplicada a la serie y su versión k-lag. R y Excel (usando CORREL) dan valores de autocorrelación ligeramente diferentes.
También me interesaría saber si un cálculo es más correcto que el otro.
                    
                        r
                                sas
                                autocorrelation
                                excel
                                
                    
                    
                        Galit Shmueli
fuente
                
                fuente

RLa fórmula de 'se analiza y explica más a fondo en stats.stackexchange.com/questions/81754/… .Respuestas:
La ecuación exacta se da en: Venables, WN y Ripley, BD (2002) Modern Applied Statistics con S. Cuarta edición. Springer-Verlag. Te daré un ejemplo:
Y así sucesivamente (por ejemplo,
res[1:47]yres[4:50]para el retraso 3).fuente
La forma ingenua de calcular la correlación automática (y posiblemente lo que usa Excel) es crear 2 copias del vector y luego eliminar los primeros n elementos de la primera copia y los últimos n elementos de la segunda copia (donde n es el retraso que usted están computando desde). Luego pase esos 2 vectores a la función para calcular la correlación. Este método está bien y dará una respuesta razonable, pero ignora el hecho de que los 2 vectores que se comparan son realmente medidas de la misma cosa.
La versión mejorada (como lo muestra Wolfgang) es una función similar a la correlación regular, excepto que usa todo el vector para calcular la media y la varianza.
fuente