Un jugador recibe un dado justo de seis lados. Para ganar, debe sacar un número mayor que 4 (es decir, un 5 o un 6). Si saca un 4, debe rodar nuevamente. ¿Cuáles son sus probabilidades de ganar?
Creo que la probabilidad de ganar , puede expresarse recursivamente como:
He aproximada como mediante la ejecución de 1 millón de ensayos en Java, como este:0.3999
import java.util.Random;
public class Dice {
public static void main(String[] args) {
int runs = 1000000000;
int wins = 0;
for (int i = 0; i < runs; i++) {
wins += playGame();
}
System.out.println(wins / (double)runs);
}
static Random r = new Random();
private static int playGame() {
int roll;
while ((roll = r.nextInt(6) + 1) == 4);
return (roll == 5 || roll == 6) ? 1 : 0;
}
}
Y veo que uno podría expandir así:
Pero no sé cómo resolver este tipo de relación de recurrencia sin recurrir a este tipo de aproximación. ¿Es posible?
probability
tronbabylove
fuente
fuente
Respuestas:
Solo resuélvelo usando álgebra:
fuente
Nota: Esta es una respuesta a la pregunta inicial, en lugar de la recurrencia.
Si saca un 4, entonces esencialmente no cuenta, porque el próximo lanzamiento es independiente. En otras palabras, después de sacar un 4, la situación es la misma que cuando comenzó. Entonces puede ignorar el 4. Entonces los resultados que podrían importar son 1-3 y 5-6. Hay 5 resultados distintos, 2 de los cuales están ganando. Entonces la respuesta es 2/5 = 0.4 = 40%.
fuente
Las respuestas de dsaxton ( /stats//a/232107/90759 ) y GeoMatt22 ( /stats//a/232107/90759 ) ofrecen los mejores enfoques para el problema. Otra es darse cuenta de que su expresión
Es realmente una progresión geométrica :
En general tenemos
así que aquí tenemos
Por supuesto, la forma de probar la fórmula general para la suma de una progresión geométrica es mediante el uso de una solución algebraica similar a dsaxton.
fuente
Todas las respuestas anteriores son correctas, pero no explican por qué son correctas y por qué puede ignorar tantos detalles y evitar tener que resolver una complicada relación de recurrencia.
La razón por la cual las otras respuestas son correctas es la propiedad Strong Markov , que para una cadena discreta de Markov es equivalente a la propiedad regular de Markov. https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property
Básicamente, la idea es que la variable aleatoria
Es un tiempo de parada . https://en.wikipedia.org/wiki/Stopping_time Un tiempo de detención es una variable aleatoria que no depende de ninguna información futura .
Puede leer más sobre los tiempos de parada y la propiedad Strong Markov en la Sección 8.3 de (la 4ta edición de) Teoría y ejemplos de probabilidad de Durrett , p. 365
fuente
Otra forma de ver el problema.
Llamemos a un 'resultado real' un 1,2,3,5 o 6.
¿Cuál es la probabilidad de ganar en el primer lanzamiento, si obtuviste un 'resultado real'? 2/5
¿Cuál es la probabilidad de ganar en el segundo lanzamiento, si el segundo lanzamiento es la primera vez que obtienes un "resultado real"? 2/5
Lo mismo para el tercero, cuarto.
Por lo tanto, puede dividir su muestra en muestras (infinitas) más pequeñas, y todas esas muestras dan la misma probabilidad.
fuente