Gusano y valor esperado de Apple

8

Una manzana se encuentra en el vértice de pentágono , y un gusano se encuentra a dos vértices de distancia, en C . Todos los días el gusano se arrastra con igual probabilidad a uno de los dos vértices adyacentes. Así, después de un día, el gusano está en el vértice B o D , cada uno con una probabilidad de 1/2 . Después de dos días, el gusano podría estar nuevamente en C , porque no tiene memoria de posiciones anteriores. Cuando alcanza el vértice A , se detiene a cenar.A B C D E C B D 1 / 2 C AAABCDECBD1/2CA

(a) ¿Cuál es la media del número de días hasta la cena?

(b) Sea p la probabilidad de que el número de días sea 100 o más. ¿Qué dice la desigualdad de Markov sobre p ?

Para (a), sea X la variable aleatoria definida por el número de días hasta la cena. Entonces

P(X=0)=0P(X=1)=0P(X=2)=1(52)

¿Cuál sería la distribución general?

Para (b), si sabemos (a), entonces sabemos que

P(X100)E(X)100
probguy3434
fuente
2
¿Podría explicar su primer conjunto de ecuaciones? No parecen dar cuenta de la posibilidad de que el gusano invierta la dirección, ni parecen correctas. Después de todo, es mucho menor que la posibilidad del camino que tiene probabilidad Tenga en cuenta que el punto de esta pregunta es que puede ser más difícil obtener la distribución completa que calcular sus expectativas; y la desigualdad de Markov, sin embargo, le permite deducir información útil solo de la expectativa. ABC(1/2)(1/2)=1/4.1/(52)=1/10ABC(1/2)(1/2)=1/4.
whuber

Respuestas:

6

En la excelente respuesta de Glen_b , muestra que puedes calcular el valor esperado analíticamente usando un sistema simple de ecuaciones lineales. Siguiendo este método analítico, puede determinar que el número esperado de movimientos a la manzana es seis. Otra excelente respuesta de Whuber muestra cómo derivar la función de masa de probabilidad para el proceso después de un número dado de movimientos, y este método también se puede utilizar para obtener una solución analítica para el valor esperado. Si desea ver más información sobre este problema, debe leer algunos documentos sobre caminatas aleatorias circulares (véase, por ejemplo, Stephens 1963 )

Para dar una visión alternativa del problema, voy a mostrarle cómo puede obtener el mismo resultado utilizando el método de fuerza bruta de calcular la cadena de Markov utilizando la computación estadística. Este método es inferior al examen analítico en muchos aspectos, pero tiene la ventaja de que le permite tratar el problema sin requerir ninguna comprensión matemática importante.


Método computacional de fuerza bruta: tomando los estados en orden , las transiciones de la cadena de Markov de acuerdo con la siguiente matriz de transición:A,B,C,D,E

P=[100001201200012012000120121200120]

El primer estado es el estado absorbente donde el gusano está en la manzana. Deje sea el número de movimientos hasta que el gusano llega a la manzana de estado . Entonces, para todos los la probabilidad de que el gusano esté en la manzana después de este número de movimientos es y, por lo tanto, el número esperado de movimientos para llegar a la manzana desde este estado es:T CATCn N P ( T Cn ) = { P n } C , ACnNP(TCn)={Pn}C,A

E(TC)=n=0P(TC>n)=n=0(1{Pn}C,A).

Los términos en la suma disminuyen exponencialmente para grande, por lo que podemos calcular el valor esperado a cualquier nivel deseado de precisión truncando la suma en un número finito de términos. (La disminución exponencial de los términos garantiza que podamos limitar el tamaño de los términos eliminados para que estén por debajo del nivel deseado). En la práctica, es fácil tomar una gran cantidad de términos hasta que el tamaño de los términos restantes sea extremadamente pequeño.n


Programación de esto en R: puede programar esto como una función al Rusar el código a continuación. Este código se ha vectorizado para generar una matriz de potencias de la matriz de transición para una secuencia finita de movimientos. También generamos una gráfica de la probabilidad de que no se haya alcanzado la manzana, lo que muestra que esto disminuye exponencialmente.

#Create function to give n-step transition matrix for n = 1,...,N
#N is the last value of n
PROB <- function(N) { P <- matrix(c(1, 0, 0, 0, 0, 
                                    1/2, 0, 1/2, 0, 0, 
                                    0, 1/2, 0, 1/2, 0,
                                    0, 0, 1/2, 0, 1/2,
                                    1/2, 0, 0, 1/2, 0),
                                  nrow = 5, ncol = 5, 
                                  byrow = TRUE);
                      PPP <- array(0, dim = c(5,5,N));
                      PPP[,,1] <- P;
                      for (n in 2:N) { PPP[,,n] <- PPP[,,n-1] %*% P; } 
                      PPP }

#Calculate probabilities of reaching apple for n = 1,...,100
N  <- 100;
DF <- data.frame(Probability = PROB(N)[3,1,], Moves = 1:N);

#Plot probability of not having reached apple
library(ggplot2);
FIGURE <- ggplot(DF, aes(x = Moves, y = 1-Probability)) +
          geom_point() +
          scale_y_log10(breaks = scales::trans_breaks("log10", function(x) 10^x),
                        labels = scales::trans_format("log10", 
                                 scales::math_format(10^.x))) +
          ggtitle('Probability that worm has not reached apple') +
          xlab('Number of Moves') + ylab('Probability');
FIGURE;

#Calculate expected number of moves to get to apple
#Calculation truncates the infinite sum at N = 100
#We add one to represent the term for n = 0
EXP <- 1 + sum(1-DF$Probability);
EXP;

[1] 6

Como puede ver en este cálculo, el número esperado de movimientos para llegar a la manzana es seis. Este cálculo fue extremadamente rápido utilizando el código vectorizado anterior para la cadena de Markov.

ingrese la descripción de la imagen aquí

Ben - Restablece a Monica
fuente
5

Solo quiero ilustrar una forma simple de ver la parte (a) sin pasar por toda la rutina de la cadena de Markov. Hay dos clases de estados de los que preocuparse: estar a un paso y estar a dos pasos (C y D son idénticos en términos de pasos esperados hasta llegar a A, y B y E son idénticos). Deje que " " represente el número de pasos que toma desde el vértice y así sucesivamente.SBB

E(SC)=1+12[E(SB)+E(SD)]=1+12[E(SB)+E(SC)]

Del mismo modo, escriba una ecuación para la expectativa de .E(SB)

Sustituya el segundo por el primero (y, por conveniencia, escriba para ) y obtendrá una solución para en un par de líneas.E ( S C ) ccE(SC)c

Glen_b -Reinstate a Monica
fuente
3
+1. También me gusta al reemplazar las expectativas por las funciones generadoras de probabilidad, se obtiene una ecuación similar, igualmente fácil de resolver, que muestra que el pgf para el estado inicial es igual a y eso conduce a una fórmula simple para cualquiera de las probabilidades. Mejor: deje que sea ​​el número de pasos que comienzan enDefina yLas relaciones son ySustituyendo el último en el primero produce para Por lo tanto, es elX y y { A , B } . f n = 2 n Pr ( X A = n ) g n = 2 n Pr ( X Bt2/(42tt2),Xyy{A,B}.fn=2nPr(XA=n)f n = f n - 1 + g n - 1 ggn=2nPr(XB=n).fn=fn1+gn1f n = f n - 1 + f n - 2 n3. f n n- 2 ndgn1=fn2.fn=fn1+fn2n3.fnn2ndNúmero de Fibonacci
whuber
@whuber: Debería convertir su comentario en una respuesta completa, es realmente bueno.
Ben - Restablece a Mónica el
1
Estoy de acuerdo, vale la pena publicarlo como respuesta, incluso en este breve formulario.
Glen_b -Reinstale a Monica el
3

El problema

Esta cadena de Markov tiene tres estados, que se distinguen por si el gusano está a o espacios lejos de Sea la variable aleatoria que indica cuántos pasos tomará el gusano para llegar a desde el estado Sus funciones generadoras de probabilidad son una forma algebraica conveniente de codificar las probabilidades de estas variables. No es necesario preocuparse por cuestiones analíticas como la convergencia: simplemente mírelas como series de poder formales en un símbolo dado por1 , 2 C . X i C i { 0 , 1 , 2 } . t0, 1,2C.XiCi{0,1,2}.t

fi(t)=Pr(Xi=0)+Pr(Xi=1)t1+Pr(Xi=2)t2++Pr(Xi=n)tn+

Como es trivial que Necesitamos encontrarf 0 ( t ) = 1. f 2 .Pr(X0=0)=1,f0(t)=1.f2.

Análisis y solución.

Desde el estado el gusano tiene las mismas posibilidades de de mover de nuevo a estado o alcanzar . Tener en cuenta este paso agrega a todas las potencias de , lo que equivale a multiplicar pgf por , dando1,2 C 1 t t1/22C1tt

f1=12t(f2+f0).

Del mismo modo, desde el estado el gusano tiene las mismas posibilidades de permanecer en el estado o alcanzar el estado donde2 1 ,221,

f2=12t(f2+f1).

La aparición de sugiere que nuestro trabajo será más fácil al introducir la variable dandox = t / 2 ,t/2x=t/2,

f1(x)=x(f2(x)+f0(x));f2(x)=x(f2(x)+f1(x)).

Sustituyendo el primero en el segundo y recordando daf0=1

(*)f2(x)=x(f2(x)+x(f2(x)+1))

cuya única solución es

(**)f2(x)=x21xx2.

Destaqué la ecuación para enfatizar su simplicidad básica y su similitud formal con la ecuación que obtendríamos al analizar solo los valores esperados en efecto, para la misma cantidad de trabajo que se necesita para encontrar este número, Obtenemos toda la distribución.()E[Xi]:

Implicaciones y simplificación.

De manera equivalente, cuando se escribe término por término y las potencias de coinciden, afirma que para()tn4,

2nPr(X2=n)=2n1Pr(X2=n1)+2n2Pr(X2=n2).

Esta es la recurrencia de la famosa secuencia de números de Fibonacci.

(Fn)=(1,1,2,3,5,8,13,21,34,55,89,144,)

(indexado desde ). La coincidencia de la solución es esta secuencia desplazada por dos lugares (porque no hay probabilidad de que o y es fácil verificar que ).n=0()X2=0X2=122Pr(X2=2)=1=23Pr(X2=3)

Por consiguiente

Pr(X2=n)=2n2Fn2.

Más específicamente,

f2(t)=22F0t2+23F1t3+24F2t4+=14t2+18t3+216t4+332t5+564t6+8128t7+13256t8+.

La expectativa de se encuentra fácilmente evaluando la derivada y sustituyendo porque (diferenciando las potencias de término por término) esto da la fórmulaX2ft=1,t

f(1)=Pr(X2=0)(0)+Pr(X2=1)(1)10++Pr(X2=n)(n)1n1+

que, como la suma de las probabilidades multiplicada por los valores de es precisamente la definición de Tomar la derivada usando produce una fórmula simple para la expectativa.X2,E[X2].()


Algunos breves comentarios

Al expandir como fracciones parciales, se puede escribir como la suma de dos series geométricas. Esto muestra inmediatamente que las probabilidades disminuirán exponencialmente. También produce una forma cerrada para las probabilidades de cola Usando eso, podemos calcular rápidamente que es un poco menos de()f2Pr(X2=n)Pr(X2>n).Pr(X2100)109.

Finalmente, estas fórmulas involucran la proporción áurea Este número es la longitud de un acorde de un pentágono regular (del lado de la unidad), produciendo una conexión sorprendente entre una cadena de Markov puramente combinatoria en el pentágono (que "no sabe" nada sobre la geometría euclidiana) y la geometría de un pentágono regular en el Avión Euclidiano.ϕ=(1+5)/2.

whuber
fuente
1

Para el número medio de días hasta la cena, condicione el paso dado el primer día. Deje que sea ​​el número de días hasta que el gusano obtenga la manzana. Deje que sea ​​el primer paso.XF

Entonces nosotros tenemos

E[X]=E[X|F=B] [P(F=B)]+E[X|F=D] P[F=D]

Si el primer paso es hacia entonces el gusano obtiene la manzana en el día 2 con probabilidad de la mitad, o regresa al vértice con probabilidad de la mitad y comienza de nuevo. Podemos escribir esto comoB,C

E[X|F=B]=2(12)+(2+E[X])(12)=2+E[X]2

Si el primer paso es hacia entonces por simetría, es lo mismo que estar en el vértice excepto que el gusano ha dado un solo paso paraCD,C

E[X|F=D]=1+E[X]

Poniendo todo junto, obtenemos

E[X]=(2+E[X]2)(12)+(1+E[X])(12)

Resolver para produceE[X]

E[X]=6
Soakley
fuente
1
Esto parece recapitular la respuesta de @ Glen_b.
whuber