¿Cuál es la varianza a largo plazo?

13

¿Cómo se define la varianza a largo plazo en el ámbito del análisis de series temporales?

Entiendo que se utiliza en el caso de que haya una estructura de correlación en los datos. ¿Entonces nuestro proceso estocástico no sería una familia de X1,X2 iid variables aleatorias sino distribuidas de manera idéntica?

¿Podría tener una referencia estándar como introducción al concepto y las dificultades involucradas en su estimación?

Monolita
fuente

Respuestas:

13

Es una medida del error estándar de la media de la muestra cuando hay dependencia en serie.

Si Yt es una covarianza estacionaria con E(Yt)=μ y Cov(Yt,Ytj)=γj (en un ajuste iid, ¡esta cantidad sería cero!) Tal que j=0|γj|< . Entonces

limT{Var[T(Y¯Tμ)]}=limT{TE(Y¯Tμ)2}=j=γj=γ0+2j=1γj,
donde la primera igualdad es definitoria, lasegunda un poco más difícil de establecery el tercero una consecuencia de la estacionariedad, lo que implica que γj=γj .

Entonces, el problema es la falta de independencia. Para ver esto más claramente, escriba la varianza de la media muestral como

E(Y¯Tμ)2=E[(1/T)t=1T(Ytμ)]2=1/T2E[{(Y1μ)+(Y2μ)++(YTμ)}{(Y1μ)+(Y2μ)++(YTμ)}]=1/T2{[γ0+γ1++γT1]+[γ1+γ0+γ1++γT2]++[γT1+γT2++γ1+γ0]}

A problem with estimating the long-run variance is that we of course do not observe all autocovariances with finite data. Kernel (in econometrics, "Newey-West" or HAC estimators) are used to this end,

JT^γ^0+2j=1T1k(jT)γ^j
k is a kernel or weighting function, the γ^j are sample autocovariances. k, among other things must be symmetric and have k(0)=1. T is a bandwidth parameter.

A popular kernel is the Bartlett kernel

k(jT)={(1jT)for0jT10forj>T1
Good textbook references are Hamilton, Time Series Analysis or Fuller. A seminal (but technical) journal article is Newey and West, Econometrica 1987.

Christoph Hanck
fuente
Thank you! I checked Time series Analysis by Hamilton. It does in fact say that a non-parametric way to estimate the spectrum is to take a weighted average of the sample covariances but It does not delve into the mathematics behind the determination of this statement. Could you suggest a reference book or paper that explains why is this a good estimator when the sample size increases?
Monolite
good point. Made some edits
Christoph Hanck
It perhaps worth mentioning that the second ("tricky") step requires dominated convergence (see stats.stackexchange.com/questions/154070/… ).
Tamas Ferenci
@TamasFerenci, thanks for the pointer, I included the link.
Christoph Hanck
@Cristoph Hanck, you're welcome, thanks for the update!
Tamas Ferenci