He encontrado dos definiciones en la literatura para el tiempo de autocorrelación de una serie temporal débilmente estacionaria:
donde es la autocorrelación en el retraso.
Una aplicación del tiempo de autocorrelación es encontrar el "tamaño de muestra efectivo": si tiene observaciones de una serie de tiempo y sabe que es el tiempo de autocorrelación τ , puede fingir que tiene
muestras independientes en lugar de correlacionadas con el fin de encontrar la media. La estimación de partir de los datos no es trivial, pero hay algunas formas de hacerlo (ver Thompson 2010 ).
La definición sin valores absolutos, , parece más común en la literatura; pero admite la posibilidad de τ a < 1 . Usando R y el paquete "coda":
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
La función "efectiveSize" en "coda" utiliza una definición del tiempo de autocorrelación equivalente a , arriba. Hay algunos otros paquetes R que calculan el tamaño efectivo de la muestra o el tiempo de autocorrelación, y todos los que he probado dan resultados consistentes con esto: que un proceso AR (1) con un coeficiente AR negativo tienemuestrasmásefectivas que las correlacionadas series de tiempo. Esto parece extraño
Obviamente, esto nunca puede suceder en el definición τ b del tiempo de autocorrelación.
¿Cuál es la definición correcta de tiempo de autocorrelación? ¿Hay algún problema con mi comprensión de los tamaños de muestra efectivos? El muestra arriba parece que debe estar equivocado ... ¿qué está pasando?
fuente
Respuestas:
Primero, la definición apropiada de "tamaño de muestra efectivo" está vinculada a una pregunta bastante específica. Si se distribuyen idénticamente con media μ y varianza 1 la media empírica μ = 1X1,X2,… μ
es un estimador insesgado deμ. ¿Pero qué hay de su varianza? Paravariablesindependientesla varianza esn-1. Para una serie de tiempo débilmente estacionaria, la varianza de μ es
1
With a negative correlation between observations it is certainly possible that the variance can become smaller thann−1 (neff>n ). This is a well known variance reduction technique in Monto Carlo integration: If we introduce negative correlation between the variables instead of correlation 0, we can reduce the variance without increasing the sample size.
fuente
see http://arxiv.org/pdf/1403.5536v1.pdf
and
https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf
for effective sample size. I think the alternative formulation using the ratio of sample variance and asymptotic Markov chain variance via batch mean is more appropriate estimator.
fuente