Proceso AR (1) con errores de medición heteroscedastic

13

1. El problema

Tengo algunas mediciones de una variable yt , donde t=1,2,..,n , para el cual tengo una distribución fyt(yt) obtenida a través de MCMC, que por simplicidad supondré que es una gaussiana de media μt y varianza σt2 .

Tengo un modelo físico para esas observaciones, digamos g(t) , pero los residuos rt=μtg(t) parecen estar correlacionados; en particular, tengo razones físicas para pensar que un proceso AR(1) será suficiente para tener en cuenta la correlación, y planeo obtener los coeficientes del ajuste a través de MCMC, para lo cual necesito la probabilidad . Creo que la solución es bastante simple, pero no estoy muy seguro (parece tan simple, que creo que me falta algo).

2. Derivando la probabilidad

Un proceso media cero se puede escribir como: X t = ϕ X t - 1 + ε t , ( 1 ) donde asumiré ε tN ( 0 , σ 2 w ) . Los parámetros a estimar son, por lo tanto, θ = { ϕ , σ 2 w } (en mi caso, también tengo que agregar los parámetros del modelo g ( t )AR(1)

Xt=ϕXt1+εt,   (1)
εtN(0,σw2)θ={ϕ,σw2}g(t), pero ese no es el problema). Sin embargo, lo que observo es la variable donde supongo que η tN ( 0 , σ 2 t ) , y se conocen los σ 2 t (los errores de medición) . Como X t es un proceso gaussiano, R t también lo es. En particular, sé que X 1N ( 0 , σ 2 w /
Rt=Xt+ηt,   (2)
ηtN(0,σt2)σt2XtRt por lo tanto, R 1N ( 0 , σ 2 w / [ 1 - ϕ 2 ] + σ 2 t ) . El próximo desafío es obtener R t | R t - 1 para t 1 . Para derivar la distribución de esta variable aleatoria, tenga en cuenta que, utilizando la ecuación. ( 2 ) Puedo escribir X t
X1N(0,σw2/[1ϕ2]),
R1N(0,σw2/[1ϕ2]+σt2).
Rt|Rt1t1(2) Usando la ecuación. (2), y usando la definición de la ecuación. (1), puedo escribir, R t = X t + η t =ϕ X t - 1 + ε t + η t . Usando la ec. (3)en esta última expresión, entonces, obtengo, R t
Xt1=Rt1ηt1.   (3)
(2)(1)
Rt=Xt+ηt=ϕXt1+εt+ηt.
(3) tanto, R t | R t - 1 = ϕ ( r t - 1 - η t - 1 ) + ε t + η t , y, por lo tanto, R t | R t - 1N (
Rt=ϕ(Rt-1-ηt-1)+εt+ηt,
RtEl |Rt-1=ϕ(rt-1-ηt-1)+εt+ηt,
Finalmente, puedo escribir la función de probabilidad como L ( θ ) = f R 1 ( R 1 = r 1 ) n t = 2 f R t | R t - 1 ( R t = r t
RtEl |Rt-1norte(ϕrt-1,σw2+σt2-ϕ2σt-12).
donde f ( ) son las distribuciones de las variables que acabo de definir, es decir, que definen σ 2 = σ 2 w / [ 1 -
L(θ)=FR1(R1=r1)t=2norteFRtEl |Rt-1(Rt=rtEl |Rt-1=rt-1),
F()σ2=σw2/ /[1-ϕ2]+σt2, y definiendoσ2(t)=σ 2 w +σ 2 t -ϕ2σ 2 t - 1 , fRt| Rt-1(Rt=rt|Rt-1=rt-1)=1
fR1(R1=r1)=12πσ2exp(r122σ2),
σ2(t)=σw2+σt2ϕ2σt12
fRt|Rt1(Rt=rt|Rt1=rt1)=12πσ2(t)exp((rtϕrt1)22σ2(t))

3. Preguntas

  1. ¿Está bien mi derivación? No tengo ningún recurso para comparar que no sean simulaciones (que parecen estar de acuerdo), ¡y no soy un estadístico!
  2. MA(1)ARMA(1,1)ARMA(p,q)
Néstor
fuente
No tengo exactamente una solución para ti. Pero, creo que este es un tipo de problema de variables de error. He visto estas cosas en la teoría macroeconómica de Thomas Sergent (libro de 1980). Es posible que desee mirar ese.
Métricas
Gracias por el aporte, @Metrics. ¡Revisaré el libro!
Néstor

Respuestas:

1
  1. Estás en el camino correcto, pero has cometido un error al derivar la distribución de Rt dado Rt-1: la media condicional no es ϕrt-1. SusϕX^t-1, dónde X^t-1 es tu mejor estimación de Xdel periodo anterior El valor deX^t-1 incluye información de observaciones anteriores, así como rt-1. (Para ver esto, considere una situación dondeσw y ϕson insignificantes, por lo que efectivamente está estimando una media fija. Después de muchas observaciones, su incertidumbre sobreX será mucho más pequeño que ση.) Esto puede ser confuso al principio, porque observa R y no X. Eso solo significa que se trata de un modelo de espacio de estado .

  2. Sí, hay un marco muy general para usar modelos lineales-gaussianos con observaciones ruidosas, llamado filtro de Kalman . Esto se aplica a cualquier cosa con una estructura ARIMA y muchos más modelos también. Tiempo variableσηestá bien para el filtro de Kalman, siempre que no sea estocástico. Los modelos con, por ejemplo, volatilidad estocástica , necesitan métodos más generales. Para ver cómo se deriva el filtro de Kalman, pruebe Durbin-Koopman o el capítulo 3 de Harvey . En la notación de Harvey, tu modelo tieneZ=1, re=C=0 0, Ht=ση,t2, T=ϕ, R=1 y Q=σw2.

Jamie Hall
fuente
Hola Jamie, gracias por tu aporte. Un par de comentarios: 1. No estoy seguro de eso. Fue, en realidad, mi primer intento como solución, pero tanto mi intuición como mis simulaciones no están de acuerdo con eso. La cosa es que en realidad no observo Xt, Yo observo Rt; Además, ¿puedes probar (aritméticamente) que la media condicional de la variable aleatoriaRtEl |Rt-1=rt-1 (tenga en cuenta que no es RtEl |Xt-1=Xt-1) es en realidad ϕX^t-1? 2. ¿Puede dar más detalles sobre la aplicación del filtro de Kalman a este problema en particular?
Néstor
Hola Nestor, he editado la respuesta para responder a tus comentarios. Espero que ayude.
Jamie Hall el
Hola Jamie: sobre el segundo punto, está bien, gracias :-)! Sin embargo, todavía no puedo ver tu primer punto. ¿Me puede señalar una derivación formal? En particular, me gustaría saber qué parte de mi razonamiento está mal (y por qué).
Néstor
Se saltó un paso: la distribución de X1 dado R1. Susnorte(σX,12(σX,12+ση,12)r1,σX,22), dónde σX,12 es la varianza que calculó en el primer paso, y σX,22 es el doble de la media armónica de σX,12 y ση,12. (Esto es como una actualización bayesiana con dos archivos PDF gaussianos). Su ecuación (3) es formalmente correcta, pero está desechando información al usar eso en lugar depag(Xt-1El |R1:t-1).
Jamie Hall
-1

Honestamente, debe codificar esto en ERRORES o STAN y no preocuparse por eso desde allí. A menos que sea una pregunta teórica.

DavidShor
fuente
2
(-1) A esta respuesta; Esta es claramente una pregunta teórica ;-). Considere mejorar por qué cree que debería codificarlo en BUGs o STAN y qué tiene que ver con la pregunta original.
Néstor