Suficiencia o Insuficiencia

9

Considere una muestra aleatoria donde son iid Bernoulli (p) variables aleatorias donde p \ in (0,1) . Compruebe si T (X) = X_1 + 2X_2 + X_3 es una estadística suficiente para p .X i B e r n o u l l i ( p ) p ( 0 , 1 ) T ( X ) = X 1 + 2 X 2 + X 3 p{X1,X2,X3}Xyosimirnorteotullyo(pag)pag(0 0,1)T(X)=X1+2X2+X3pag

En primer lugar, ¿cómo podemos encontrar la distribución para (X1+2X2+X3) ? ¿O debería desglosarse en X1+X2+X2+X3 y luego esto seguirá siyonorte(4 4,pag) ? Creo que no porque tenga en cuenta que todas las variables no son independientes aquí.

Alternativamente, si utilizo la condición de factorización simplemente considerando la pmf conjunta de (X1,X2,X3) entonces F(X1,X2,X3)=pagX1+X2+X3(1-pag)3-(X1+X2+X3)=[pagt(X)(1-pag)3-t(X)]pag-X2(1-pag)X2 donde t(X)=X1+2X2+X3 .

Esto muestra que T no es suficiente.

Pero, ¿qué pasa si quiero seguir la definición y quiero aplicar F(XEl |pag)sol(T(X)El |pag) para verificar si esta relación es independiente de pag ? Entonces necesito saber la distribución de sol . Entonces, ¿cuál es la distribución de T(X)=X1+2X2+X3 ?

Landon Carter
fuente
1
Sugerencia: No necesita conocer la distribución completa de . Considere, por ejemplo, el caso : ¿cuál es la distribución de probabilidad condicional de ? T ( X ) = 2 ( X | T ( X ) = 2 )T(X)T(X)=2(XEl |T(X)=2)
whuber
Si entonces . Entonces que depende de , ¿correcto? ( X 1 , X 2 , X 3 ) { ( 1 , 0 , 1 ) , ( 0 , 1 , 0 ) } P ( X | T ( X ) = 2 ) = p 2 ( 1 - p ) + = p ( 1 - p )T(X)=2(X1,X2,X3){(1,0 0,1),(0 0,1,0 0)}PAG(XEl |T(X)=2)=pag2(1-pag)+pag(1-pag)2=pag(1-pag)pag
Landon Carter
1
Esa es la idea correcta, pero no veo por qué está agregando las dos probabilidades. ¿No es un vector ? (Si lo desea, puede usar el mismo tipo de cálculos para encontrar la distribución completa de (solo puede alcanzar los valores ), pero ya no es necesario, ¿verdad? ))T ( X ) 0 , 1 , 2 , 3 , 4XT(X)0 0,1,2,3,4 4
whuber
Sí claro. ¡Gracias! Entonces, una vez que demostremos que esta relación no es independiente de durante al menos una muestra, ¡ya está! Gracias. Y FELIZ AÑO NUEVO :)pag
Landon Carter
Sí, es un vector, pero lo más importante es X = ( X 1 , X 2 , X 3 ) y la probabilidad P ( X | T ( X ) = 2 ) = P ( T ( X ) = 2 ) = P ( X = ( 1 , 0 , 1 ) ) + P ( X = ( 0XX=(X1,X2,X3) . Por favor, corríjame si estoy equivocado. PAG(XEl |T(X)=2)=PAG(T(X)=2)=PAG(X=(1,0 0,1))+PAG(X=(0 0,1,0 0))
Landon Carter

Respuestas:

10

Tuve una discusión con "whuber" y tal vez obtuve una pista (¿correcta?) Para mirar cualquier punto de muestra: evaluar en ese punto de muestraxy compruebe si esta relación es independiente del parámetro, en este casop.PAG(X=X)PAG(T(X)=T(X))Xpag

Entonces tome luego T ( 1 , 0 , 1 ) = 2 . Entonces evaluamos P ( X = ( 1 , 0 , 1 ) )X=(1,0 0,1)T(1,0 0,1)=2 . Ahora,T(X)=2 iff X{(1,0,1),(0,1,0)}. Debido a la propiedad iid,P(X=(1,0,1))=p2(1-p)PAG(X=(1,0 0,1))PAG(T(X)=2)

T(X)=2 iff X{(1,0 0,1),(0 0,1,0 0)}.
También P ( T ( X ) = 2 ) = P ( X = ( 1 , 0 , 1 ) ) + P ( X = ( 0 , 1 , 0 ) ) = p
PAG(X=(1,0 0,1))=pag2(1-pag) y PAG(X=(0 0,1,0 0))=pag(1-pag)2.
PAG(T(X)=2)=PAG(X=(1,0 0,1))+PAG(X=(0 0,1,0 0))=pag(1-pag).

Por lo tanto, que depende claramente dep, y por lo tantoTno es una estadística suficiente.

PAG(X=(1,0 0,1))PAG(T(X)=2)=pag2(1-pag)pag(1-pag)=pag
pagT
Landon Carter
fuente