¿Argumento fácilmente comprensible de que los métodos normales de Runge-Kutta no pueden generalizarse a las SDE?

9

Un enfoque ingenuo para resolver ecuaciones diferenciales estocásticas (SDE) sería:

  • tome un método Runge – Kutta regular de varios pasos,
  • utilizar una discretización suficientemente fina del proceso Wiener subyacente,
  • haga que cada paso del método Runge-Kutta sea análogo a un Euler-Maruyama.

Ahora, esto falla en múltiples niveles y entiendo por qué. Sin embargo, ahora tengo la tarea de convencer a las personas de este hecho que tienen poco conocimiento de los métodos de Runge-Kutta y las ecuaciones diferenciales estocásticas para empezar. Todos los argumentos que conozco no son nada que pueda comunicar bien en el contexto dado. Por lo tanto, estoy buscando un argumento fácilmente comprensible de que el enfoque anterior esté condenado.

Wrzlprmft
fuente
@BiswajitBanerjee: Soy consciente de esto y, de hecho, no afirmo haberlo entendido en la mayor medida posible. Aún así, no creo que proporcionar todos los argumentos aquí mejorará la respuesta ya que aquellos que pueden proporcionar una respuesta son conscientes de ellos. Además, este caso es algo especial, ya que se trata de explicar por qué algo no funciona, para lo cual, naturalmente, hay muchas respuestas, comenzando con "lo probamos y falló".
Wrzlprmft
No estaba hablando de expertos en EDO estocásticas, sino del lector promedio que entiende las variables aleatorias y RK cuando dije "nosotros". Sin embargo, no te molestaré más si no quieres dar un ejemplo de tu pensamiento.
Biswajit Banerjee

Respuestas:

13

Tomemos una ecuación diferencial estocástica:

Xt=F(t,Xt)ret+sol(t,Xt)reWt

Aquí hay algunos argumentos diferentes que conducen a una comprensión intuitiva de por qué es necesaria la matemática detrás de los métodos de orden superior. Discutiré en términos de orden fuerte, que es lo mismo que decir "para un movimiento browniano dado , ¿qué tan bien la integral numérica resuelve esa trayectoria?"W(t)

Regularidad de la ecuación

En primer lugar, su método propuesto no tiene en cuenta el hecho de que no es continuamente diferenciable. En realidad, puede usar los resultados de Rossler para mostrar que extender los métodos RK normales como sugirió dará como resultado métodos convergentes, pero solo tendrán un orden fuerte de 0.5. La razón es porque se derivaron usando cálculo con X t siendo diferenciable y teniendo una serie de Taylor. El movimiento browniano no es diferenciable, y en su lugar tiene una continuidad de titular de α < 0.5 comoXtXtα<0,5

Sin embargo, como en la teoría de perturbaciones, los procesos que no son lo suficientemente regulares no son expandibles en términos de una serie de Taylor, pero con la regularidad de Holder se pueden expandir en términos de una serie de Puiseux con términos de α , es decir, para el movimiento browniano existe un extensión a la noción de la serie Taylor que se expande en términos de algo así como 1αα derivados. Al igual que en el cálculo regular, el primer término es el "término lineal", es decir, cambiadtaΔtydWtaN(0,dt)y obtienes algo correcto. Es por eso que los métodos, que incluyen cosas como Euler-Maruyama, convergen con un orden fuerte de 0.5: obtienen el primer término de la serie de Taylor correcto. Sin embargo, los términos de orden superior deben tener las correcciones por el hecho de queXtno es continuamente diferenciable, razón por la cual los métodos normales no lo hacen.12retΔtreWtnorte(0 0,ret)Xt

Correlaciones instantáneas e integrales iteradas

Esa es una explicación heurística rápida, pero hay un poco más. Veamos algunos otros detalles. Una serie de Taylor no es solo la expansión en términos de derivados, sino que también puede considerarse como el número de términos de orden superior para integrar. está integrando una vez. Pero si agrega el término d t 2 , para obtener las unidades correctas, necesita hacer integrales dobles. d t 2 es fácil de integrar dos veces, pero qué es d W i t d W j tXt=X0 0+ΔtF(t,Xt)ret2ret2reWtyoreWtj? Estas son las correlaciones instantáneas entre los movimientos brownianos. Necesita saber esto para calcular la integral doble. Si solo está mirando promedios, puede cortar esto. Pero en cualquier trayectoria hay correlaciones entre los diferentes movimientos brownianos de un sistema de ecuaciones diferenciales. Suponiendo que no hay correlaciones entre los movimientos brownianos, es otra forma de caracterizar la extensión de Maruyama de los métodos deterministas, pero para obtener el siguiente término de la serie (el término 1.0) debe hacerlo correctamente. La corrección de Milstein está agregando precisamente estos términos de correlación. Cuando el ruido es diagonal, esto es equivalente a comprender que no hay correlación excepto consigo misma, pero que la correlación con uno mismo es solo la varianza que es ret, y entonces debe haber una corrección de vs d t , es decir, d W 2 - d t . Cuando hay ruido no diagonal, estas integrales dobles deben aproximarse para que se tengan en cuenta las correlaciones instantáneas de los movimientos brownianos, y la aproximación común aquí es la aproximación de Wiktorsson, que es lo que hace que las simulaciones de ruido no diagonales sean tan complicadas (ya que no hay una solución analítica incluso para las integrales dobles).reWt2retreW2-ret

Efecto promedio de difusión

O(Δt)sol

solsolXtreWtreWtΔtsol(t,Xt)

sol(t+Δt,Xt+Δt)-sol(t,Xt)Δt

Xt+Δt=Xt+sol(t,Xt)Δt

solXtsol(t,Xt)ΔtCyoXt+CyoΔtsol(t,Xt)CyoΔtsol(t,Xt)Δt

Conclusión

O(Δt)O(Δt)

Por supuesto, en algunas circunstancias hay formas de encontrar generalizaciones apropiadas que den métodos de orden superior, pero lo dejaré como un hilo colgante porque ese es un punto de un documento que enviaré pronto. Espero que esto ayude.

Chris Rackauckas
fuente