Esa expresión regular representa una cadena de Markov en estados correspondientes a un estado de inicio cada una de las letras. Se realiza una transición de a , de a , ..., y de la penúltima letra a la última, siempre con probabilidad . De lo contrario, el estado sigue siendo el mismo. El estado final es un estado absorbente: cuando se ha alcanzado, todas las letras se han observado en secuencia.m+1ssaabp
En términos de los estados , la matriz de transición es(s,a,b,…)
PAGSmetro=⎛⎝⎜⎜⎜⎜⎜⎜⎜1 - p0 0⋮0 00 0pags1 - p0 0⋯0 00 0pags⋱0 0⋯⋯⋯pags1 - p0 00 00 0⋮pags1⎞⎠⎟⎟⎟⎟⎟⎟⎟
Las técnicas algebraicas lineales estándar (la forma normal de Jordan de y su matriz de cambio de base son simples y dispersas, lo que hace que sea bastante fácil de hacer) establecen que para la última entrada en la primera fila de la poder de matriz esPAGSmetron ≥ mPAGSnortemetro
PAGSnortemetro( 1 , m + 1 ) =pagsmetro∑i = 0n - m(m - 1 + im - 1) (1-p)yo.
Esta es la oportunidad de alcanzar el estado absorbente desde el estado inicial después de transiciones: responde la pregunta. Si lo desea, puede expresarse en "forma cerrada" en términos de una función hipergeométrica comonorte
PAGSnortemetro( 1 , m + 1 ) = 1 -pagsmetro(nortem - 1) (1-p)- m + n + 12F1( 1 , n + 1 ; n + 2 - m ; 1 - p ) .
La suma tiene una agradable interpretación combinatoria. Sea la posición en la que aparece la última letra. Está precedido por una secuencia (posiblemente vacía) de no- , cada una con una probabilidad de de ocurrir; entonces una con una posibilidad de ocurrir; a continuación, una (posiblemente no vacío) secuencia de la no s, etc. Hay emplazamientos en los que para colocar la primera aparición de un , a continuación, la primera aparición de a después de eso, etc. Por lo tanto, incluyendo la primera aparición de la última letra en la posición probabilidad esm + iuna1 - punapagssi(m - 1 + im - 1)unasim + i(m - 1 + im - 1)pagsmetro(1−p)k . Esto da un término de la suma. Por lo tanto, la suma divide las secuencias de acuerdo con el lugar donde aparece la última letra, que puede estar en cualquier lugar desde la posición hasta , que obviamente son disjuntas, y suma sus probabilidades.m+0m+(n−m)
Como un ejemplo simple para aclarar la interpretación, suponga que y considere . Hay cuatro secuencias de tres símbolos, cada uno de la probabilidad , y otras tres secuencias de la probabilidad , en los que los símbolos y aparecen en orden:m=2n=3p3p2(1−2p)ab
aab,aba,abb,bab;ab$,a$b,$ab.
La oportunidad por lo tanto es
4p3+3p2(1−2p)=3p2−2p3=p2( 3 - 2 p ) =pags2( 1 + 2 ( 1 - p ) ) =PAGS32( 1 , 3 ) .
La interpretación combinatoria es que la expresión regular ^ab
(con en la posición ) ocurre con probabilidad ; y , con en la posición , ocurre de dos maneras como y , cada una con probabilidad .si2pags2^[^a]*a[^b]*b
si3^a[^b]b
^[^a]ab
pags2( 1 - p )