Tengo una matriz de recuento de transiciones empírica Q. Tengo una cadena de Markov teórica de primer orden P. Digamos que N es el número de transiciones. Me gustaría probar si Q es compatible con P. ¿Es correcto encontrar la matriz de transición de recuento teórica (N * P) que calcula las estadísticas de chi-cuadrado,y luego calcular el valor p de un distribución con ¿grados de libertad?
hypothesis-testing
chi-squared
markov-process
Giorgio Spedicato
fuente
fuente
Respuestas:
Asumiendo que sus matrices son algo así como
No estoy seguro de que pueda agrupar todas las filas, porque el "número de intentos" variará entre las filas.
Por ejemplo decirK=3 y tus datos son x=[1,1,2,1,2,3,1,2] . Entonces hayN=7 transiciones, con n1=4 procedente de x=1 , pero n2=2 desde x=2 y solo y n3=1 desde x=3 . Entonces creo que tu confianza enp^1 generalmente debe ser mayor que su confianza en p^3 .
(En el caso extremo, tal vez para este ejemploK Fue en realidad 4 , pero no tiene datos en absoluto sobre esas transiciones, como n4=0 . Tratar la "ausencia de evidencia como evidencia de ausencia" me parece problemático aquí).
No estoy muy familiarizado con las pruebas de ji cuadrado, pero esto sugiere que es posible que desee tratar las filas de forma independiente (es decir, sumar solo más dej , y use ni más bien que N ) Este razonamiento no parece específico de la prueba de ji cuadrado, por lo que también debe aplicarse a cualquier otra prueba de significación que pueda usar (por ejemplo, multinomio exacto ).
La cuestión clave es que las probabilidades de transición son condicionales , por lo que para cada entrada de matriz solo son relevantes las transiciones que satisfacen su condición previa. De hecho, presumiblemente la matriz de transición satisfará∑jPij=1 , por lo tanto, la "matriz de transición empírica" debe ser P^ij=Qij/ni .
Actualización: en respuesta a la consulta de OP, una aclaración sobre los "parámetros de prueba".
Si hayK estados en la cadena de Markov, es decir P∈RK×K , luego por fila i , la distribución multinomial correspondiente tendrá un vector de probabilidadpi∈RK y número de ensayos ni∈N , dado anteriormente.
Entonces habráK categorías y el vector de probabilidad pi tendrá K−1 grados de libertad, como ∑Kj=1(pi)j=1 . Entonces para la filai el correspondiente χ2 estadística sería
Se puede ser posible hacer una "prueba agrupados", asumiendoχ2P=∑iχ2i sigue una distribución chi-cuadrado con K(K−1) dof's (es decir, sumando dofs sobre filas). Sin embargo, no estoy seguro de si elχ2i Puede ser tratado como independiente. En cualquier caso, las pruebas en filas parecen ser más informativas, por lo que pueden ser preferibles a una prueba agrupada.
fuente