MLE de un proceso de Hawkes multivariante

9

Estoy luchando con la implementación del estimador de máxima verosimilitud para un proceso de Hawkes (HP) multivariante. Específicamente, aunque la expresión analítica para una función de probabilidad logarítmica de un HP univariante se puede encontrar fácilmente en línea (por ejemplo, Ozaki, 1979), parece haber versiones diferentes (¿inconsistentes o equivalentes?) De la función de probabilidad logarítmica de un HP multivariante allí afuera. También intenté derivar el estimador yo mismo a continuación y obtengo otro resultado (aunque soy muy nuevo en este tema). ¿Alguien podría aclarar esto por mí? ¡Gracias!

Este es mi propio ir a una derivación (sigo la notación utilizada en Laub et al., 2015). Considere una colección demetro procesos de conteo norte=(norte1,..,nortemetro) con tyo,j los tiempos de llegada observados para cada proceso de conteo (yo=1,..,metro y jun número natural) Defina un HP multivariante con funciones de exictación exponencialmente decrecientes de modo que las intensidades seanλyo(t)=λyo+j=1metrotj,k<tαyo,jmi-βyo,j(t-tj,k). Para esta variante m HP, la probabilidad de registroEnL(t) es igual a la suma de las probabilidades de registro individuales, es decir: EnL(t)=j=1metroEnLj(t), con cada componente individual EnLj(t)=-0 0Tλj(tu)retu+0 0TEnλj(tu)renortej(tu).

Centrémonos primero en la primera parte, que llamamos compensador Λ.

ingrese la descripción de la imagen aquí

La combinación de esto con los resultados para las otras partes de la probabilidad de registro debería resultar en: EnL1(tyo)=-λ1T-α1,1β1,1F=1F[mi-β1,1(t1,F-t1,F)-1]-α1,2β1,2sol=1sol[mi-β1,2(t2,sol-t2,sol)-1]+F=1FEn[λ1+j=12α1,jR1,j(F)]

con R1,j(F)=tj,k<t1,Fmi-β1,j(t1,F-tj,k). Se puede derivar una expresión similar paraEnL2(tyo).

Sin embargo, cuando comparo este resultado con otros artículos, noto algunas diferencias. Por ejemplo, en Toke (diapositiva 56) la expresión para el compensador es muy diferente (suma sobre cada elemento para cada tipo de evento) y, además, no hayλyoTtérmino. Luego, en Crowley (2013) (pág. 29) la expresión para el compensador es mucho más elaborada. Además, la ecuación de 2.8 (página 9) en Zheng (2013) ofrece nuevamente una alternativa (sumas sobre un subconjunto de los elementos para cada tipo de evento) (nota: hay una implementación de Matlab al final del documento). El artículo que se parece principalmente a lo que encuentro es la página 6 en Carlsson et al. (2007) Como puede ver, estoy claramente confundido. ¿Cuál es la función de probabilidad correcta que debo programar?

Referencias

  • Ozaki, 1979, Estimación de máxima verosimilitud de los procesos puntuales de autoexcitación de Hawkes

  • Crowley, 2013, Modelos de proceso puntual para datos multivariados de alta frecuencia con espacios irregulares

  • Laub, Taimre y Pollett, 2015, Procesos Hawkes

  • Zheng, 2013, dinámica de alta frecuencia del flujo de pedidos

  • Carlsson, Foo, Lee & Shek, 2007, Predicción comercial de alta frecuencia con el proceso de bivariado Hawkes

Pilik
fuente
Si desea una respuesta a por qué su resultado difiere de una referencia en particular, sugiero, como mínimo, agregar un enlace a la referencia. Mejor aún, proporcione los resultados exactos de la referencia en su pregunta y explique en detalle por qué cree que difiere de su resultado. Esto aumentará la posibilidad de que alguien brinde una respuesta.
NRH
El enlace a mi artículo es vixra.org/pdf/1211.0094v8.pdf
crow
¿Recibiste una respuesta a esta pregunta? He notado lo mismo y es muy frustrante. Incluso en la página de Wikipedia, la función es diferente: en.wikipedia.org/wiki/Point_process#Likelihood_function
Freelunch

Respuestas:

3

Hay un pequeño error en la derivación. En la línea 5 (en la figura insertada) uno necesitaT=t1,F=t2,solpara que la identidad sea correcta, y este generalmente no es el caso. Los términos en las sumas finales deben sermi-βyo,1(T-t1,F)-1 y mi-βyo,2(T-t2,sol)-1, respectivamente. De lo contrario, la derivación parece correcta.

Una derivación ligeramente más simple puede tomar la línea 3 como punto de partida. Luego intercambie las sumas y la integración con el ser integral interno resultante detj,k a T.

Vale la pena señalar que para el proceso de Hawkes considerado aquí, es posible calcular λyo(tyo,j) de forma recursiva, lo que implica que la complejidad computacional de la probabilidad logarítmica puede hacerse lineal en el número de saltos (en lugar de cuadrática como sugiere la suma doble sobre los saltos).

Dudo que haya versiones inconsistentes de la probabilidad en la literatura, pero, por supuesto, puede haber errores en algunas de las referencias. Otra posibilidad (probable) es que la notación o los supuestos difieran, o que las representaciones sean, de hecho, equivalentes, pero escritas de diferentes maneras. Una posibilidad es que la intensidad de referenciaλyo se omite, de modo que el λyoT el término desaparece

NRH
fuente