¿Es posible estimar las probabilidades de ganar un concurso de múltiples entradas, cuando no conozco el desglose de las entradas?

8

Supongamos que participo en un concurso , con las siguientes reglas:

  • Cada persona puede obtener hasta 6 entradas
  • Todas las entradas serán agrupadas, y el 25% de las entradas serán seleccionadas para ser ganadoras, con un máximo de 25.
  • Cada persona solo puede ganar una vez, independientemente del número de sus entradas. Si el nombre de alguien se vuelve a dibujar, se descarta y se dibuja un nuevo nombre.
  • Sé cuántas entradas tengo (el máximo, 6)
  • Sé cuántas entradas totales hay, desglosadas por tipo de entrada
  • Yo no sé cómo muchas de las entradas son entradas repetidas por la misma persona.

El recuento de entradas por tipo es el siguiente:

Tipo 1: 42 Tipo 2: 72 Tipo 3: 119 Tipo 4: 217 Tipo 5: 156 Tipo 6: 178

¿Es posible estimar mis probabilidades de ganar en esta situación? Estoy un poco confundido por el hecho de que no puedo predecir cómo los primeros ganadores afectarán mis posibilidades, ya que no sé cuántas entradas eliminará cada ganador del grupo.

Estoy interesado en la solución dado el conjunto de datos, pero también estoy interesado en el procedimiento / algoritmo adecuado para calcularlo.

agent86
fuente
¿Qué significan los "tipos"?
Macro
@Marco Los diferentes tipos de boletos que puede ganar. Por lo tanto, puede ganar boletos de lotería del 1 al 6, y 42 personas ganaron el boleto del tipo 1
Rachel
Tengo problemas para seguir la secuencia de publicaciones porque se ejecutan de abajo hacia arriba. Pero dado el tiempo a la derecha del nombre de los carteles, creo que lo he descubierto. Entonces, ¿alguien podría decirme si tengo esto claro? Creo que la respuesta de Whuber no puede ser correcta debido a la ambigüedad entre las entradas y los participantes. La estrategia de Rachel para obtener el peor de los casos y el mejor de los casos es correcta, pero cometió un error matemático al agregar porcentajes cuando pueden basarse en diferentes denominadores. Entonces, si corregimos ese error, tenemos los límites correctos en la solución.
Michael R. Chernick
Pensé que era extraño para Rachel referirse al mejor escenario como el que dio el mayor porcentaje de victorias y el peor de los casos, el que dio el más bajo. Ganar es bueno, ¿verdad? El último punto que me gustaría aclarar: Cardinal afirma que en este caso el 25% de los participantes supera los 25, por lo que solo habrá 25 ganadores. Obtiene esto al saber que al menos 178 personas ingresan y, por supuesto, una vez que el número de participantes supera los 100, el total de ganadores se corta a 25 según las reglas.
Michael R. Chernick
@cardinal, ¿cómo se te ocurrió el número 178? Agregué todas las entradas por tipos para obtener un total de 784. En el peor de los casos, como jugador, todos obtuvieron 6 entradas y 784/6 = 130.7. Así que concluyo que debe haber al menos 130 entradas. Esto todavía significa que se aplica el límite de 25, pero ¿cómo llegaste al número más alto?
Michael R. Chernick

Respuestas:

6

Las posibilidades posibles se encuentran entre 17.7% y 18.7%.

El peor de los casos ocurre cuando todos menos uno tiene exactamente una entrada en la lotería: esta es una configuración consistente con los datos (¡aunque poco probable!).

Vamos a contar la cantidad de posibilidades en las que no ganas. Este es el número de formas de extraer tickets de los tickets restantes, dados por el coeficiente binomial . (Es un gran número). El número total de posibilidades, todas ellas igualmente probables en un sorteo justo, es . La proporción se simplifica a , que es aproximadamente 82.22772%: sus posibilidades de no ganar. Sus posibilidades de ganar en esta situación, por lo tanto, son iguales a 1 - 82.22772% = 17.7228% .257846(784625)(78425)(78425)(78430)/[(784)(7845)]

El mejor caso ocurre cuando hay tan pocas personas involucradas en la lotería como sea posible y la mayor cantidad posible tiene , y luego , etc., boletos. Dado que los recuentos de "gemas" son (en orden ascendente), esto implica65(42,72,119,156,178,217)

  • Como máximo personas pueden tener entradas cada una.42=a66

  • Como máximo, personas pueden tener entradas cada una.7242=30=a55

    ...

  • Como máximo personas pueden tener entradas cada una.178156=22=a22

  • 217178=39=a1 personas tienen entrada cada una.1

Deje que designe la posibilidad de ganar cuando tiene (entre y ) boletos en una lotería con datos y sorteos. Por lo tanto, el número total de tickets es igual a . Considere el próximo sorteo. Hay siete posibilidades:p(a,l,j)j16a=(a1,a2,,a6)l=251a1+2a2++6a6=n

  1. Uno de tus boletos está sorteado; tú ganas. La posibilidad de esto es igual a .j/n

  2. Las entradas de otra persona están sorteadas. La posibilidad de esto es igual a . Si ellos tienen de ellos, entonces todos los entradas se retiran de la lotería. Si , el dibujo continúa con los nuevos datos: ha disminuido en y ha disminuido en . La posibilidad de que se elija a una persona con boletos en la lotería, dado que los suyos no, es igual a . Esto proporciona seis posibilidades disjuntas para .(nj)/niil1l1ai1iiai/(nj)i=1,2,,6

Agregamos estas oportunidades porque dividen todos los resultados sin superposición.

El cálculo continúa recursivamente por este árbol de probabilidad hasta que se alcanzan todas las hojas en . Es una gran cantidad de cálculos (aproximadamente = 244 millones de cálculos), pero solo lleva unos minutos (o menos, dependiendo de la plataforma). Obtengo 18.6475% posibilidades de ganar en este caso.l=0256

Aquí está el código de Mathematica que usé. (Está escrito en paralelo al análisis anterior, se podría hacer un poco más eficiente a través de algunas reducciones algebraicas y las pruebas para cuando se reduce a ). Aquí, el argumento no sin contar los boletos usted lleva a cabo: se da la distribución de conteos de boletos que todos los demás tienen.ai0aj

p[a_, l_Integer, j_Integer] /; l >= 1 := p[a, l, j] = Module[{k = Length[a], n},
    n = Range[k] . a + j;
    j/n + (n - j)/n ParallelSum[
       i a[[i]] / (n - j) p[a - UnitVector[k, i], l - 1, j], {i, 1, k}]
    ];
p[a_, 0, j_Integer] := 0;
(* The data *)
a = Reverse[Differences[Prepend[Sort[{42, 72, 119, 217, 156, 178}], 0]]];
j = 6; l = 25;
(* The solution *)
p[a - UnitVector[Length[a],j], l, j] // N

Como comprobación de la realidad, comparemos estas respuestas con dos aproximaciones ingenuas (ninguna de las cuales es del todo correcta):

  1. 25 sorteos con 6 boletos en juego deberían darte alrededor de 6 * 25 de 784 posibilidades de ganar. Esto es 19.1%.

  2. Cada vez que tu oportunidad de no ganar es de (784-6) / 784. Eleve esto al poder número 25 para encontrar su oportunidad de no ganar en la lotería. Restarlo de 1 da 17.5%.

Parece que estamos en el estadio correcto.

whuber
fuente
1
Me gusta este problema porque proporciona un ejemplo real de dos tipos de incertidumbre: incertidumbre probabilística en la lotería y falta de conocimiento sobre la verdadera distribución de la propiedad del boleto dentro de la lotería. He tratado eficazmente la última incertidumbre utilizando el análisis de intervalos, que simplemente intenta limitar las posibilidades lo más estrictamente posible. Otros podrían seguir adelante y adoptar una distribución previa para describir esta incertidumbre epistémica, pero no puedo concebir una forma válida de justificar cualquier previo dado la información disponible.
whuber
Pero está suponiendo que nadie puede tener 2 o más de un boleto de tipo particular ("gema"). Hasta donde puedo ver, esto no se especifica en la descripción del problema de los OP (agent86s).
Michael R. Chernick
@Michael Tienes razón, no está perfectamente claro en las reglas del juego, aunque está muy implícito que nadie recolecta más de uno de cada tipo de gema. Vide la regla 1 en la pregunta original: "cada persona puede obtener hasta 6 entradas".
whuber
1
Hasta donde yo sé (y se ha demostrado durante el concurso), la suposición de la información dada es correcta: ninguna persona puede tener más de 6 entradas, una de cada "tipo".
agent86
1
¡Muchas gracias por tomarse el tiempo de responder esto! He estado pensando en este problema desde ayer, y desperté esta mañana decidido a averiguar esto si él me mató, y estoy feliz de ver una gran explicación ya publicado por lo que ahora no tengo que :)
Rachel
1

Si lo hacía la derecha matemáticas, que tiene entre 19.43%y 21.15%posibilidades de ganar un premio

Este 19.43%es el mejor de los casos, donde cada participante tiene 6 boletos

Este 21.15%es el peor de los casos, donde cada participante tiene 1 boleto excepto usted

Ambos escenarios son extremadamente improbables, por lo que sus probabilidades reales de ganar probablemente caigan en algún punto intermedio, sin embargo, una probabilidad de aproximadamente 1/5 de ganar parece un número bastante sólido.

Los detalles sobre cómo se obtuvieron esos números se pueden encontrar en esta hoja de cálculo de Google , sin embargo, para resumir cómo se obtuvieron:

  1. Comience con el número total de entradas (784) y sus entradas (6)
  2. Tener la oportunidad de ganar ( 6 / 784 = 0.77%)
  3. Resta 6 para el mejor caso, o 1 para el peor caso de TotalEntries
  4. Tener la oportunidad de ganar ( 6/778para el mejor caso 6/783para el peor caso)
  5. Repita los pasos 3-4 hasta que tenga 25 porcentajes
  6. Sume los 25 porcentajes juntos para descubrir su probabilidad general de ganar algo

Aquí hay una forma alternativa de obtener el porcentaje aproximado que es más simple, pero no es tan preciso ya que no está eliminando entradas duplicadas cada vez que dibuja un ganador.

6 (your tickets) / 784 total tickets = 0.00765
0.00765 chance to win * 25 prizes = 19.14 % chance to win

EDITAR: estoy bastante seguro de que me falta algo en mis matemáticas y que no puedes simplemente agregar porcentajes como este (o multiplicar el porcentaje de posibilidades de ganar por # de premios), aunque creo que estoy cerca

El comentario de Whobar ofrece un 17.4% de posibilidades de ganar, aunque todavía necesito averiguar la fórmula que dio y asegurarme de que sea precisa para el concurso. Quizás un proyecto de fin de semana :)

Rachel
fuente
Solo señalaré que esto supone que tienes 6 gemas.
murgatroid99
@ murgatroid99 Sí, la pregunta indicada I know how many entries I have (the maximum, 6):) Puedo hacer que la hoja de cálculo sea editable por cualquiera que quiera averiguar sus probabilidades de ganar
Rachel
2
Creo que estas cifras están en el estadio correcto en general, pero están fuera en un par por ciento. Es difícil saberlo ya que no se ha proporcionado una descripción del cálculo que ha realizado en la publicación misma.
cardenal
1
Según su descripción, parece que la discrepancia probablemente surge del hecho de que no ha incorporado la probabilidad de llegar al paso antes de ser elegido. Por ejemplo, en el peor de los casos, la probabilidad de ser seleccionado en el tercer sorteo es . k(7787776)/(784783782)
cardenal
2
Rachel, da la posibilidad de que una persona con entradas entre tenga al menos una de ellas elegida cuando 25 dibujado. (Se basa en contar cuántas formas no se pudieron sacar los boletos de esa persona , dividir entre el número total de posibles sorteos y restar esa proporción de ). Para el valor es 17.7%. Sin embargo, no sé si así es como se debe ejecutar la lotería. 1(n625)(n25)6n1n=784
whuber