Estimación de caminata aleatoria con AR (1)

Cuando calculo una caminata aleatoria con un AR (1), el coeficiente es muy cercano a 1 pero siempre menor.

¿Cuál es la razón matemática por la cual el coeficiente no es mayor que uno?

regression autoregressive random-walk Marco
fuente

Intenté con la caja de herramientas de Matlab y también con mi script en arima (donde los coeficientes están limitados a [-10,10] y el resultado es el mismo). Intento con un OLS simple y el resultado es el mismo.

Marco

La estimación está sesgada hacia abajo, tenemos que leer el papel de Dickey y Fuller.

Marco

Respuestas:

Estimamos por OLS el modelo

X_{t} = ρ X_{t - 1} + {tu}_{t}, mi ({tu}_{t} ∣ {X_{t - 1}, X_{t - 2}, . . .}) = 0 0, X_{0 0} = 0 0

$x_{t} = \rho x_{t-1} + u_t,\;\; E(u_t \mid \{x_{t-1}, x_{t-2},...\}) =0,\;x_0 =0$

Para una muestra de tamaño T, el estimador es

\hat{ρ} = \frac{\sum_{t = 1}^{T} X_{t} X_{t - 1}}{\sum_{t = 1}^{T} X_{t - 1}^{2}} = ρ + \frac{\sum_{t = 1}^{T} {tu}_{t} X_{t - 1}}{\sum_{t = 1}^{T} X_{t - 1}^{2}}

$\hat \rho = \frac {\sum_{t=1}^T x_{t}x_{t-1}}{\sum_{t=1}^T x_{t-1}^2} = \rho + \frac {\sum_{t=1}^T u_tx_{t-1}}{\sum_{t=1}^T x_{t-1}^2}$

Si el verdadero mecanismo de generación de datos es una caminata aleatoria pura, entonces , y $\rho=1$

X_{t} = X_{t - 1} + {tu}_{t} ⟹ X_{t} = \sum_{yo = 1}^{t} {tu}_{yo}

$x_{t} = x_{t-1} + u_t \implies x_t= \sum_{i=1}^t u_i$

La distribución de muestreo de la OLS estimador, o equivalentemente, la distribución de muestreo de , no es de alrededor simétrica cero, sino que es sesgada a la izquierda de cero, con % de los valores obtenidos (es decir masa de probabilidad) ser negativo, por lo que obtener más a menudo que no . Aquí hay una distribución de frecuencia relativa $\hat \rho - 1$ $\approx 68$ $\approx$ $\hat \rho < 1$

ingrese la descripción de la imagen aquí

\begin{aligned} Media: - 0.0017773 \\ Mediana: - 0.00085984 \\ Mínimo: - 0.042875 \\ Máximo: 0.0052173 \\ Desviación Estándar: 0.0031625 \\ Oblicuidad: - 2.2568 \\ Ex. curtosis: 8.3017 \end{aligned}

$\begin{align} \text{Mean:} -0.0017773\\ \text{Median:} -0.00085984\\ \text{Minimum: } -0.042875\\ \text{Maximum: } 0.0052173\\ \text{Standard deviation: } 0.0031625\\ \text{Skewness: } -2.2568\\ \text{Ex. kurtosis: } 8.3017\\ \end{align}$

Esto a veces se llama la distribución "Dickey-Fuller", porque es la base de los valores críticos utilizados para realizar las pruebas de raíz unitaria del mismo nombre.

No recuerdo haber visto un intento de proporcionar intuición para la forma de la distribución de muestreo. Estamos viendo la distribución muestral de la variable aleatoria

\hat{ρ} - 1 = (\sum_{t = 1}^{T} {tu}_{t} X_{t - 1}) \cdot (\frac{1}{\sum_{t = 1}^{T} X_{t - 1}^{2}})

$\hat \rho - 1 = \left(\sum_{t=1}^T u_tx_{t-1}\right)\cdot \left(\frac {1}{\sum_{t=1}^T x_{t-1}^2}\right)$

Si 's son Normal Normal, entonces el primer componente de $u_t$ $\hat \rho - 1$ $\hat \rho - 1$

$T=5$

Si sumamos productos normales independientes, obtenemos una distribución que permanece simétrica alrededor de cero. Por ejemplo:

ingrese la descripción de la imagen aquí

Pero si sumamos productos normales no independientes como es nuestro caso, obtenemos

ingrese la descripción de la imagen aquí

que está sesgada a la derecha pero con más probabilidad de masa asignada a los valores negativos. Y parece que la masa se empuja aún más hacia la izquierda si aumentamos el tamaño de la muestra y agregamos más elementos correlacionados a la suma.

El recíproco de la suma de Gammas no independientes es una variable aleatoria no negativa con sesgo positivo.

$\hat \rho -1$

Alecos Papadopoulos
fuente

Wow, buen análisis! ¿Podría indicar cuál de los supuestos estándar de OLS se viola aquí?

Richard Hardy

@ RichardHardy Gracias. Volveré más tarde para responder a tu comentario.

Alecos Papadopoulos

Todavía tengo curiosidad por los supuestos de OLS ... ¡Gracias de antemano!

Richard Hardy

X_{t + 1} = α X_{t} + ϵ

$X_{t+1} = \alpha X_t + \epsilon$

X_{t + 1} - X_{t}

$X_{t+1} - X_t$

\hat{ρ} < 1

$\hat \rho<1$

\hat{ρ} - 1

$\hat \rho-1$

Esto no es realmente una respuesta, pero es demasiado largo para un comentario, así que publico esto de todos modos.

Pude obtener un coeficiente mayor que 1 dos veces de cien para un tamaño de muestra de 100 (usando "R"):

N=100                   # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~y[-T])    # regress y on its own first lag, with intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

Las realizaciones 84 y 95 tienen un coeficiente superior a 1, por lo que no siempre es inferior a uno. Sin embargo, la tendencia es claramente tener una estimación sesgada hacia abajo. La pregunta sigue siendo, ¿por qué ?

Editar: las regresiones anteriores incluyeron un término de intercepción que no parece pertenecer al modelo. Una vez que se elimina la intercepción, obtengo muchas más estimaciones por encima de 1 (3158 de cada 10000), pero aún así está claramente por debajo del 50% de todos los casos:

N=10000                 # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

Richard Hardy
fuente

exactamente, no "siempre" menor, pero en la mayoría de los casos. Obviamente es un resultado espurio. por que la razon

Marco

x_{t}

$x_t$

x_{t - 1}

$x_{t-1}$