¿Todas las bolas de la urna son del mismo color (cuando no se pueden ver con claridad)

8

Tengo un problema que se reduce a bolas en las urnas (en realidad se trata de alelos alternativos y de referencia en las poblaciones).

Supongamos que tengo una urna grande bien mezclada (sorteos iid) que puede contener dos colores de bolas: aguamarina y azul huevo de petirrojo ( a y r respectivamente). Son de color cercano, por lo que a veces una persona que los clasifica comete un error al identificar el color después de sacar una bola de una urna. Dejarmirser la probabilidad de un error cuando la pelota es realmente r ymiunacuando la pelota es realmente a . Suponga que conozco estos números (creo que son menores a 0.01 pero aún necesitan verificar) y he elegido un significado.

En un experimento, mi compañero dibuja norte bolas de la urna e identifica rbolas como color r yunacomo un (norte=r+una) Luego me dicer y una. Quiero probarH0 0que todas las bolas son r versusHunala urna contiene al menos una bola dada la cantidad de bolas extraídas.

Mi objetivo es realizar la prueba en 2 niveles diferentes para dar una calificación de "estrella" a la solidez de los resultados informados. No se pudo rechazar a 0.05 = 2 estrellas, rechazado a 0.05 = 3 estrellas y rechazado a 0.01 = 4 estrellas.

¿Qué prueba puedo usar para este problema? (Aunque he puesto esto en términos convencionales, estaría contento de obtener un factor de Bayes y establecer umbrales basados ​​en eso. También estoy contento con las pruebas que requieren un cierto número de mediciones para la validez; solo puedo clasificar muestras que son demasiado pequeñas como "no se pudo rechazar")

Tenga en cuenta que esto es diferente a probar una proporción porque esas pruebas no tienen error en la medición (y no funcionan para la proporción = 0 o 1). Pensé en intentar establecer un valor distinto de ceroH0 0 proporción utilizando algún tipo de factor de fudge basado en la tasa de error y el tamaño de la muestra (por ejemplo, pruebas H0 0=PAGSmir dónde PAGSes la verdadera proporción, pero no pude encontrar un número bien justificado). También comencé a tratar de obtener mi propia prueba, pero me estaba tomando bastante tiempo y este parece ser el tipo de problema que alguien habría investigado antes.

Editar Reescribió la pregunta ligeramente para aclarar que no sé la secuencia de sorteos / clasificaciones

Epónimo
fuente

Respuestas:

2

Admito que no leí completamente la otra respuesta, pero un enfoque burdo sería solo notar que a sigue un binomio(n,p=er) distribución cuando todas las bolas son de color azul huevo de Robin, por lo que puede rechazar cuando aes "demasiado grande" según el modelo binomial. Si esto no funciona, entonces quizás sea mejor una prueba de razón de probabilidad, que parece ser a lo que Zachary Blumenfeld está llegando.

dsaxton
fuente
1

Creo que tengo la función de probabilidad (Revelador completo, no estoy 100% seguro). Una vez que obtenga una probabilidad, el resto de la prueba de hipótesis debería ser más fácil.

Supongamos que dibujaste una muestra de tamaño n denotado como (X1,...Xn). Por simplicidad, digamos;

Xi={1ifclassifiedascolora0ifclassifiedascolorr
Denota además el indicador de color "verdadero" de observación i como Xi tal que
Xyo={1yoFosismirvunatyoonorteyosColoruna0 0yoFosismirvunatyoonorteyosColorr
Supongamos también que se conoce la tasa de error, mir(0 0,1).

La probabilidad de Xyo condicional en Xyo, es entonces una distribución de Bernoulli;

P(Xi=1|Xi,er)={1erifXi=1erifXi=0
También podemos expresar esto como;
P(Xi|Xi,er)=Xi[(1er)Xier1Xi]+(1Xi)[erXi(1er)1Xi]
También sabemos la probabilidad de Xi
P(Xi|p)=pXi(1p)1Xi
y eso
PAGS(XyoEl |mir,pags)=PAGS(XyoEl |Xyo=1,mir)PAGS(Xyo=1El |pags)+PAGS(XyoEl |Xyo=0 0,mir)PAGS(Xyo=0 0El |pags)
y luego después de un poco de álgebra;
PAGS(XyoEl |mir,pags)=pags[(1-mir)Xyomir1-Xyo]+(1-pags)[mirXyo(1-mir)1-Xyo]

Entonces su probabilidad es;

L(pagsX1,..,Xnorte,mir)=yo=1nortePAGS(XyoEl |mir,pags)
=yo=1nortepags[(1-mir)Xyomir1-Xyo]+(1-pags)[mirXyo(1-mir)1-Xyo]

Su prueba de hipótesis se reduce a H0 0:pags=1 vs H1:pags0 0. Puede hacerlo con un factor de Bayes, o con un error estándar derivado de la probabilidad, o incluso a través de un arranque paramétrico. Como quieras. Ahora que tiene la probabilidad, el resto debería ser fácil.

Zachary Blumenfeld
fuente
Veo P(Xi=1|Xi,er) pero no P(Xi=0|Xi,ea). Que hacerP(Xi|...), Creo que necesitas ambos er y ea
Eponymous
Lo siento, asumí er=eaen este problema, por lo que habrá que cambiarlo. También escribí la hipótesis al revés (lo nulo debería serp=0, pero eso también se cambia fácilmente.
Zachary Blumenfeld