Números esperados de colores distintos al dibujar sin reemplazo

15

Considere una urna que contiene bolas de diferentes colores, siendo la proporción de bolas de color entre las bolas ( ). Extraigo bolas de la urna sin reemplazo y miro el número de diferentes colores entre las bolas que se dibujaron. ¿Cuál es la expectativa de en función de , dependiendo de las propiedades adecuadas de la distribución ?P p i i N i p i = 1 n NNPpiiNipi=1nNγ n / N pγγn/Np

Para dar más información: si y para todo , siempre veré exactamente colores, es decir, . De lo contrario, se puede demostrar que la expectativa de es . Para y fijos , parecería que el factor por el cual multiplicar sería máximo cuando es uniforme; ¿tal vez el número esperado de colores diferentes visto esté limitado en función de y, por ejemplo, la entropía de ?p i = 1 / P i n γ = P ( n / N ) γ > P ( n / N ) P N n / N p n / N pN=Ppi=1/Pinγ=P(n/N)γ>P(n/N)PNn/Npn/Np

Esto parece estar relacionado con el problema del recolector de cupones, excepto que el muestreo se realiza sin reemplazo y la distribución de los cupones no es uniforme.

a3nm
fuente
1
Creo que este problema puede plantearse como: ¿cuál es el número esperado de entradas distintas de cero en una muestra de una distribución hipergeométrica multivariada ?
Kodiólogo

Respuestas:

2

Suponga que tiene colores, donde k N . Let b i denota el número de bolas de color i tan Σ b i = N . Dejar que B = { b 1 , ... , b k } y dejar E i ( B ) notate el conjunto que se compone de los i subconjuntos de elementos de B . Sea Q n , c el número de formas en que podemos elegir nkkNbiibi=NB={b1,,bk}Ei(B)iBQn,cnelementos del conjunto anterior de modo que el número de colores diferentes en el conjunto elegido sea . Para c = 1 la fórmula es simple:cc=1

Qn,1=EE1(B)(eEen)

Para podemos contar conjuntos de bolas de tamaño n que tiene como máximo 2 colores menos el número de conjuntos que tienen exactamente 1 color:c=2n1

Qn,2=EE2(B)(eEen)(k11)Qn,1

es la cantidad de formas en que puede agregar un color a un color fijo, de modo que tendrá 2 colores si tienekcolores en total. La fórmula genérica es si tienec1colores fijos y desea hacerc2colores mientras tienekcolores en total (c1c2k) es ( k-c1(k11)kc1c2kc1c2k. Ahora tenemos todo para derivar la fórmula genérica paraQn,c:(kc1c2c1)Qn,c

Qn,c=EEc(B)(eEen)i=1c1(kici)Qn,i

La probabilidad de que tenga exactamente colores si dibuja n bolas es:cn

Pn,c=Qn,c/(Nn)

También tenga en cuenta que (xy)=0 if y>x.

Probably there are special cases where the formula can be simplified. I didn't bother to find those simplifications this time.

The expected value you're looking for the number of colors dependent on n is the following:

γn=i=1kPn,ii
jakab922
fuente
4
You call Pn,c a probability, but you seem to have defined it as a sum of integers. Did you forget to divide by something?
Kodiologist
Yes, I guess you're right. You need to divide by (Nn), but unfortunately it's still not right that way. If E,FEc(B) and EF I do doublecounting in the above formula.
jakab922
Seems like the formula can be fixed by using the sieve method. I will post a fix later today.
jakab922