Supongamos que tengo una urna que contiene N colores diferentes de bolas y cada color diferente puede aparecer un número diferente de veces (si hay 10 bolas rojas, no es necesario que también haya 10 bolas azules). Si conocemos el contenido exacto de la urna antes de dibujar, podemos formar una distribución de probabilidad discreta que nos indica la probabilidad de dibujar cada color de bola. Lo que me pregunto es cómo cambia la distribución después de sacar k bolas sin reemplazo de la urna en promedio. Entiendo que a medida que sacamos de la urna podemos actualizar la distribución con el conocimiento de lo que se ha sacado, pero lo que quiero saber es qué esperaríamos que sea la forma de la distribución después de haber eliminado k bolas. ¿La distribución cambia en promedio o permanece igual? Si no permanece igual, ¿podemos escribir alguna fórmula para lo que esperamos que se vea en promedio la nueva distribución después de hacer k sorteos?
fuente
Respuestas:
Por supuesto, este mismo argumento se aplica a cualquier color en el segundo sorteo. Podemos aplicar el mismo tipo de argumento de forma recursiva cuando consideramos sorteos posteriores.
fuente
La única razón por la que no es perfectamente obvio que la distribución permanezca sin cambios (siempre que quede al menos una bola) es porque hay demasiada información. Eliminemos el material que distrae.
Este argumento, aunque perfectamente válido, podría hacer que algunas personas se sientan incómodas. El siguiente análisis podría aceptarse como más riguroso, porque no nos pide que ignoremos el orden de selección.
Cuando no depende de , QED .k<n k
fuente
Dejemos que la distribución de dibujar una sola bola, después de haber sacado bolas sin reemplazo, tenga una distribución categórica dada la distribución sobre tales distribuciones categóricas .k E(Dk) Dk
Supongo que estás preguntando si es constante.E(Dk)
Creo que es. Supongamos que eventualmente dibujas todas las bolas. Todas las permutaciones de las bolas son igualmente probables. La probabilidad de dibujar inicialmente es . Podrías reorganizar tus elecciones a una permutación igualmente probable por la cual tu primera bola elegida fue elegida en último lugar, y tu segunda elegida fue elegida primero. Esa bola tiene la expectativa , que debe ser igual a debido a la simetría. Por inducción, las son todas iguales.E(D0) E(D1) E(D0) E(Di)
fuente
La "distribución esperada" no cambia. ¡Se podría usar un argumento de martingala! Agregaré eso a la respuesta más tarde (ahora estoy viajando).
La distribución, condicional a los sorteos anteriores (para los sorteos posteriores) solo cambia cuando realmente observa los sorteos. Si saca la bola de la urna con la mano bien cerrada y luego la tira sin observar su color (he usado ese teatro de manera efectiva como demostración de clase), la distribución no cambia. Este hecho tiene una explicación: la probabilidad se trata de información, la probabilidad es un concepto de información.
Entonces, las probabilidades cambian solo cuando obtienes nueva información (probabilidades condicionales, es decir). Sacar la pelota y tirarla sin observarla no le da ninguna información nueva, por lo que no hay nada nuevo para condicionar. Entonces, cuando condiciona el conjunto de información real, eso no ha cambiado, por lo que la distribución condicional no puede cambiar.
Ahora no daré muchos más detalles a esta respuesta, solo agregaré una referencia: Hosam M. Mahmoud: "Pólya Urn Models" (Chapman & Hall), que trata los modelos de urna como el de esta pregunta, y también una urna mucho más generalizada. esquemas, también mediante el uso de métodos de martingala para obtener resultados límite. Pero los métodos de martingala no son necesarios para la pregunta en esta publicación.
fuente