¿La distribución de probabilidad de una urna cambia a medida que la extrae sin reemplazo en promedio?

9

Supongamos que tengo una urna que contiene N colores diferentes de bolas y cada color diferente puede aparecer un número diferente de veces (si hay 10 bolas rojas, no es necesario que también haya 10 bolas azules). Si conocemos el contenido exacto de la urna antes de dibujar, podemos formar una distribución de probabilidad discreta que nos indica la probabilidad de dibujar cada color de bola. Lo que me pregunto es cómo cambia la distribución después de sacar k bolas sin reemplazo de la urna en promedio. Entiendo que a medida que sacamos de la urna podemos actualizar la distribución con el conocimiento de lo que se ha sacado, pero lo que quiero saber es qué esperaríamos que sea la forma de la distribución después de haber eliminado k bolas. ¿La distribución cambia en promedio o permanece igual? Si no permanece igual, ¿podemos escribir alguna fórmula para lo que esperamos que se vea en promedio la nueva distribución después de hacer k sorteos?

mjnichol
fuente
1
Podría estar equivocado, pero parece que uno conoce la distribución previa, pero no tiene información sobre la probabilidad (además de que se eliminan k bolas). en ese caso, supondría que el posterior es igual al anterior. Para ser justos: hay información de probabilidad de que el número de bolas ha disminuido y que (para una bola eliminada) la distribución es, por ejemplo, bimodal entre el 50% de posibilidad de 9 rojo y 10 negro y el 50% de posibilidad de 10 rojo y 9 negro . Aunque me equivoco aquí
Wouter
Mi intuición es que es como el último caso que describiste. Sin embargo, no puedo encontrar a nadie hablando sobre este tipo de proceso.
mjnichol

Respuestas:

7
  1. nmnwXii

    P(X2=W)=P(X2=W|X1=W)P(X1=W)+P(X2=W|X1=W¯)P(X1=W¯)=nw1n1nwn+nwn1nnwn=nw(nnw+nw1)n(n1)=nwn=P(X1=W)

    Por supuesto, este mismo argumento se aplica a cualquier color en el segundo sorteo. Podemos aplicar el mismo tipo de argumento de forma recursiva cuando consideramos sorteos posteriores.

    kikik+1

  2. 1,2,...,nk1

    k1k

Glen_b -Reinstate a Monica
fuente
1stkthk1k1
@Silverfish Sí, mirándolo, mi segundo argumento es esencialmente el mismo tipo de argumento que el argumento de permutación de Neil.
Glen_b -Reinstate Monica
Gracias por la explicación. ¡Era exactamente lo que necesitaba ver!
mjnichol
6

La única razón por la que no es perfectamente obvio que la distribución permanezca sin cambios (siempre que quede al menos una bola) es porque hay demasiada información. Eliminemos el material que distrae.

kk+1kk


Este argumento, aunque perfectamente válido, podría hacer que algunas personas se sientan incómodas. El siguiente análisis podría aceptarse como más riguroso, porque no nos pide que ignoremos el orden de selección.

pkk+1pkpk0

CkCkCCn

Prk(C)=kcpknpk=kcn.

Cuando no depende de , QED .k<nk

whuber
fuente
Gracias por el comentario. ¡Me ayudó a comprender más los procesos subyacentes!
mjnichol
2

Dejemos que la distribución de dibujar una sola bola, después de haber sacado bolas sin reemplazo, tenga una distribución categórica dada la distribución sobre tales distribuciones categóricas .kE(Dk)Dk

Supongo que estás preguntando si es constante.E(Dk)

Creo que es. Supongamos que eventualmente dibujas todas las bolas. Todas las permutaciones de las bolas son igualmente probables. La probabilidad de dibujar inicialmente es . Podrías reorganizar tus elecciones a una permutación igualmente probable por la cual tu primera bola elegida fue elegida en último lugar, y tu segunda elegida fue elegida primero. Esa bola tiene la expectativa , que debe ser igual a debido a la simetría. Por inducción, las son todas iguales.E(D0)E(D1)E(D0)E(Di)

Neil G
fuente
Quiere decir que estoy preguntando si es constante para cada k, ¿verdad? E(Dk)
mjnichol
@mjnichol derecha
Neil G
0

La "distribución esperada" no cambia. ¡Se podría usar un argumento de martingala! Agregaré eso a la respuesta más tarde (ahora estoy viajando).

La distribución, condicional a los sorteos anteriores (para los sorteos posteriores) solo cambia cuando realmente observa los sorteos. Si saca la bola de la urna con la mano bien cerrada y luego la tira sin observar su color (he usado ese teatro de manera efectiva como demostración de clase), la distribución no cambia. Este hecho tiene una explicación: la probabilidad se trata de información, la probabilidad es un concepto de información.

Entonces, las probabilidades cambian solo cuando obtienes nueva información (probabilidades condicionales, es decir). Sacar la pelota y tirarla sin observarla no le da ninguna información nueva, por lo que no hay nada nuevo para condicionar. Entonces, cuando condiciona el conjunto de información real, eso no ha cambiado, por lo que la distribución condicional no puede cambiar.

 EDIT

Ahora no daré muchos más detalles a esta respuesta, solo agregaré una referencia: Hosam M. Mahmoud: "Pólya Urn Models" (Chapman & Hall), que trata los modelos de urna como el de esta pregunta, y también una urna mucho más generalizada. esquemas, también mediante el uso de métodos de martingala para obtener resultados límite. Pero los métodos de martingala no son necesarios para la pregunta en esta publicación.

kjetil b halvorsen
fuente
La distribución (para los sorteos posteriores) no cambia incluso cuando realmente observa los sorteos. ¿Por qué observar algo cambia algo?
Neil G
1
@Neil Creo que kjetil se refiere a la distribución condicional en los sorteos observados .
Silverfish
@Silverfish: Ah, ya veo. Tienes razón, mis disculpas.
Neil G
Lo editaré para aclararlo cuando esté en casa en unas dos semanas. Por ahora vacaciones en Venecia ...
kjetil b halvorsen