MLE de un proceso de Hawkes multivariante

Estoy luchando con la implementación del estimador de máxima verosimilitud para un proceso de Hawkes (HP) multivariante. Específicamente, aunque la expresión analítica para una función de probabilidad logarítmica de un HP univariante se puede encontrar fácilmente en línea (por ejemplo, Ozaki, 1979), parece haber versiones diferentes (¿inconsistentes o equivalentes?) De la función de probabilidad logarítmica de un HP multivariante allí afuera. También intenté derivar el estimador yo mismo a continuación y obtengo otro resultado (aunque soy muy nuevo en este tema). ¿Alguien podría aclarar esto por mí? ¡Gracias!

Este es mi propio ir a una derivación (sigo la notación utilizada en Laub et al., 2015). Considere una colección de $m$ procesos de conteo $N=(N_{1},..,N_{m})$ con $t_{i,j}$ los tiempos de llegada observados para cada proceso de conteo ( $i=1,..,m$ y $j$ un número natural) Defina un HP multivariante con funciones de exictación exponencialmente decrecientes de modo que las intensidades sean $\lambda^{*}_{i}(t)=\lambda_{i}+\sum\limits_{j=1}^{m}\sum\limits_{t_{j,k}<t}\alpha_{i,j}e^{-\beta_{i,j}(t-t_{j,k})}$ . Para esta variante m HP, la probabilidad de registro $\ln L(t)$ es igual a la suma de las probabilidades de registro individuales, es decir: $\ln L(t)=\sum\limits_{j=1}^{m} \ln L^{j}(t)$ , con cada componente individual $\ln L^{j}(t)=-\int\limits_{0}^{T} \lambda^{*}_{j}(u)\mathrm{d}u+\int\limits_{0}^{T} \ln\lambda^{*}_{j}(u)\mathrm{d}N_{j}(u)$ .

Centrémonos primero en la primera parte, que llamamos compensador $\varLambda$ .

La combinación de esto con los resultados para las otras partes de la probabilidad de registro debería resultar en: $\ln L^{1}(t_i)= -\lambda_{1}T - \frac{\alpha_{1,1}}{\beta_{1,1}}\sum\limits_{f=1}^{F}[e^{-\beta_{1,1} (t_{1,F} - t_{1,f})}-1] - \frac{\alpha_{1,2}}{\beta_{1,2}}\sum\limits_{g=1}^{G}[e^{-\beta_{1,2} (t_{2,G} - t_{2,g})}-1] + \sum\limits_{f=1}^{F} \ln [\lambda_{1}+\sum\limits_{j=1}^{2} \alpha_{1,j}R_{1,j}(f)]$

con $R_{1,j}(f)= \sum\limits_{t_{j,k}<t_{1,f}}e^{-\beta_{1,j}(t_{1,f}-t_{j,k})}$ . Se puede derivar una expresión similar para $\ln L^{2}(t_i)$ .

Sin embargo, cuando comparo este resultado con otros artículos, noto algunas diferencias. Por ejemplo, en Toke (diapositiva 56) la expresión para el compensador es muy diferente (suma sobre cada elemento para cada tipo de evento) y, además, no hay $\lambda_{i}T$ término. Luego, en Crowley (2013) (pág. 29) la expresión para el compensador es mucho más elaborada. Además, la ecuación de 2.8 (página 9) en Zheng (2013) ofrece nuevamente una alternativa (sumas sobre un subconjunto de los elementos para cada tipo de evento) (nota: hay una implementación de Matlab al final del documento). El artículo que se parece principalmente a lo que encuentro es la página 6 en Carlsson et al. (2007) Como puede ver, estoy claramente confundido. ¿Cuál es la función de probabilidad correcta que debo programar?

Referencias

Ozaki, 1979, Estimación de máxima verosimilitud de los procesos puntuales de autoexcitación de Hawkes
Crowley, 2013, Modelos de proceso puntual para datos multivariados de alta frecuencia con espacios irregulares
Laub, Taimre y Pollett, 2015, Procesos Hawkes
Zheng, 2013, dinámica de alta frecuencia del flujo de pedidos
Carlsson, Foo, Lee & Shek, 2007, Predicción comercial de alta frecuencia con el proceso de bivariado Hawkes

maximum-likelihood stochastic-processes likelihood Pilik
fuente

Si desea una respuesta a por qué su resultado difiere de una referencia en particular, sugiero, como mínimo, agregar un enlace a la referencia. Mejor aún, proporcione los resultados exactos de la referencia en su pregunta y explique en detalle por qué cree que difiere de su resultado. Esto aumentará la posibilidad de que alguien brinde una respuesta.

NRH

El enlace a mi artículo es vixra.org/pdf/1211.0094v8.pdf

crow

¿Recibiste una respuesta a esta pregunta? He notado lo mismo y es muy frustrante. Incluso en la página de Wikipedia, la función es diferente: en.wikipedia.org/wiki/Point_process#Likelihood_function

Freelunch

Hay un pequeño error en la derivación. En la línea 5 (en la figura insertada) uno necesita $T = t_{1,F} = t_{2,G}$ para que la identidad sea correcta, y este generalmente no es el caso. Los términos en las sumas finales deben ser $e^{-\beta_{i,1}(T - t_{1,f})} - 1$ y $e^{-\beta_{i,2}(T - t_{2,g})} - 1$ , respectivamente. De lo contrario, la derivación parece correcta.

Una derivación ligeramente más simple puede tomar la línea 3 como punto de partida. Luego intercambie las sumas y la integración con el ser integral interno resultante de $t_{j,k}$ a $T$ .

Vale la pena señalar que para el proceso de Hawkes considerado aquí, es posible calcular $\lambda_i^*(t_{i,j})$ de forma recursiva, lo que implica que la complejidad computacional de la probabilidad logarítmica puede hacerse lineal en el número de saltos (en lugar de cuadrática como sugiere la suma doble sobre los saltos).

Dudo que haya versiones inconsistentes de la probabilidad en la literatura, pero, por supuesto, puede haber errores en algunas de las referencias. Otra posibilidad (probable) es que la notación o los supuestos difieran, o que las representaciones sean, de hecho, equivalentes, pero escritas de diferentes maneras. Una posibilidad es que la intensidad de referencia $\lambda_i$ se omite, de modo que el $\lambda_i T$ el término desaparece

NRH
fuente

MLE de un proceso de Hawkes multivariante

Respuestas: