¿Todas las bolas de la urna son del mismo color (cuando no se pueden ver con claridad)

8

Tengo un problema que se reduce a bolas en las urnas (en realidad se trata de alelos alternativos y de referencia en las poblaciones).

Supongamos que tengo una urna grande bien mezclada (sorteos iid) que puede contener dos colores de bolas: aguamarina y azul huevo de petirrojo ( a y r respectivamente). Son de color cercano, por lo que a veces una persona que los clasifica comete un error al identificar el color después de sacar una bola de una urna. Dejar $e_r$ ser la probabilidad de un error cuando la pelota es realmente r y $e_a$ cuando la pelota es realmente a . Suponga que conozco estos números (creo que son menores a 0.01 pero aún necesitan verificar) y he elegido un significado.

En un experimento, mi compañero dibuja $n$ bolas de la urna e identifica $r$ bolas como color r y $a$ como un ( $n=r+a$ ) Luego me dice $r$ y $a$ . Quiero probar $H_0$ que todas las bolas son r versus $H_a$ la urna contiene al menos una bola dada la cantidad de bolas extraídas.

Mi objetivo es realizar la prueba en 2 niveles diferentes para dar una calificación de "estrella" a la solidez de los resultados informados. No se pudo rechazar a 0.05 = 2 estrellas, rechazado a 0.05 = 3 estrellas y rechazado a 0.01 = 4 estrellas.

¿Qué prueba puedo usar para este problema? (Aunque he puesto esto en términos convencionales, estaría contento de obtener un factor de Bayes y establecer umbrales basados en eso. También estoy contento con las pruebas que requieren un cierto número de mediciones para la validez; solo puedo clasificar muestras que son demasiado pequeñas como "no se pudo rechazar")

Tenga en cuenta que esto es diferente a probar una proporción porque esas pruebas no tienen error en la medición (y no funcionan para la proporción = 0 o 1). Pensé en intentar establecer un valor distinto de cero $H_0$ proporción utilizando algún tipo de factor de fudge basado en la tasa de error y el tamaño de la muestra (por ejemplo, pruebas $H_0=P \le e_r$ dónde $P$ es la verdadera proporción, pero no pude encontrar un número bien justificado). También comencé a tratar de obtener mi propia prueba, pero me estaba tomando bastante tiempo y este parece ser el tipo de problema que alguien habría investigado antes.

Editar Reescribió la pregunta ligeramente para aclarar que no sé la secuencia de sorteos / clasificaciones

hypothesis-testing Epónimo
fuente

2

Admito que no leí completamente la otra respuesta, pero un enfoque burdo sería solo notar que $a$ sigue un binomio $(n, p = e_r)$ distribución cuando todas las bolas son de color azul huevo de Robin, por lo que puede rechazar cuando $a$ es "demasiado grande" según el modelo binomial. Si esto no funciona, entonces quizás sea mejor una prueba de razón de probabilidad, que parece ser a lo que Zachary Blumenfeld está llegando.

dsaxton
fuente

1

Creo que tengo la función de probabilidad (Revelador completo, no estoy 100% seguro). Una vez que obtenga una probabilidad, el resto de la prueba de hipótesis debería ser más fácil.

Supongamos que dibujaste una muestra de tamaño $n$ denotado como $(X_1,...X_n)$ . Por simplicidad, digamos;

X_{i} = {\begin{cases} 1 i f c l a s s i f i e d a s c o l o r a \\ 0 i f c l a s s i f i e d a s c o l o r r \end{cases}

$X_i = \begin{cases} 1\;\;\mathrm{if \; classified \; as\; color}\;\;\mathbf{a}\\ 0\;\;\mathrm{if \; classified \; as\; color}\;\;\mathbf{r} \end{cases}$ Denota además el indicador de color "verdadero" de observación

i

$i$ como

X_{i}^{*}

$X_i^*$ tal que

X_{yo}^{*} = {\begin{cases} 1 yo F o si s mi r v una t yo o norte yo s C o l o r una \\ 0 0 yo F o si s mi r v una t yo o norte yo s C o l o r r \end{cases}

$X^*_i = \begin{cases} 1\;\;\mathrm{if \; observation\; \; is\; color}\;\;\mathbf{a}\\ 0\;\;\mathrm{if \; observation \; is\; color}\;\;\mathbf{r} \end{cases}$ Supongamos también que se conoce la tasa de error,

e_{r} \in (0, 1)

$e_r \in (0,1)$ .

La probabilidad de $X_i$ condicional en $X^*_i$ , es entonces una distribución de Bernoulli;

P (X_{i} = 1 | X_{i}^{*}, e_{r}) = {\begin{cases} 1 - e_{r} i f X_{i}^{*} = 1 \\ e_{r} i f X_{i}^{*} = 0 \end{cases}

$P(X_i=1|X^*_i,e_r)=\begin{cases} 1-e_r\;\;\mathrm{if}\;\;X^*_i=1\\ e_r\;\;\mathrm{if}\;\;X^*_i=0 \end{cases}$ También podemos expresar esto como;

P (X_{i} | X_{i}^{*}, e_{r}) = X_{i}^{*} [(1 - e_{r})^{X_{i}} e_{r}^{1 - X_{i}}] + (1 - X_{i}^{*}) [e_{r}^{X_{i}} (1 - e_{r})^{1 - X_{i}}]

$P(X_i|X^*_i,e_r)=X^*_i\bigg[(1-e_r)^{X_i} e_r^{1-X_i}\bigg]+(1-X^*_i)\bigg[e_r^{X_i} (1-e_r)^{1-X_i}\bigg]$ También sabemos la probabilidad de

X_{i}^{*}

$X^*_i$

P (X_{i}^{*} | p) = p^{X_{i}^{*}} (1 - p)^{1 - X_{i}^{*}}

$P(X^*_i|p) = p^{X^*_i}(1-p)^{1-X^*_i}$ y eso

PAGS (X_{yo} El | {mi}_{r}, pags) = PAGS (X_{yo} El | X_{yo}^{*} = 1, {mi}_{r}) PAGS (X_{yo}^{*} = 1 El | pags) + PAGS (X_{yo} El | X_{yo}^{*} = 0 0, {mi}_{r}) PAGS (X_{yo}^{*} = 0 0 El | pags)

PAGS (X_{yo} El | {mi}_{r}, pags) = pags [(1 - {mi}_{r})^{X_{yo}} {mi}_{r}^{1 - X_{yo}}] + (1 - pags) [{mi}_{r}^{X_{yo}} (1 - {mi}_{r})^{1 - X_{yo}}]

$P(X_i|e_r,p) = p\bigg[(1-e_r)^{X_i} e_r^{1-X_i}\bigg]+(1-p)\bigg[e_r^{X_i} (1-e_r)^{1-X_i}\bigg]$

Entonces su probabilidad es;

L (pags ∣ X_{1}, . ., X_{norte}, {mi}_{r}) = \prod_{yo = 1}^{norte} PAGS (X_{yo} El | {mi}_{r}, pags)

$\mathcal{L}(p\mid X_1,..,X_n,e_r)=\prod_{i=1}^n P(X_i|e_r,p)$

= \prod_{yo = 1}^{norte} pags [(1 - {mi}_{r})^{X_{yo}} {mi}_{r}^{1 - X_{yo}}] + (1 - pags) [{mi}_{r}^{X_{yo}} (1 - {mi}_{r})^{1 - X_{yo}}]

$= \prod_{i=1}^n p\bigg[(1-e_r)^{X_i} e_r^{1-X_i}\bigg]+(1-p)\bigg[e_r^{X_i} (1-e_r)^{1-X_i}\bigg]$

Su prueba de hipótesis se reduce a $H_0: p=1$ vs $H_1: p\neq 0$ . Puede hacerlo con un factor de Bayes, o con un error estándar derivado de la probabilidad, o incluso a través de un arranque paramétrico. Como quieras. Ahora que tiene la probabilidad, el resto debería ser fácil.

Zachary Blumenfeld
fuente

Veo

P (X_{i} = 1 | X_{i}^{*}, e_{r})

$P(X_i=1|X_i^*,e_r)$ pero no

P (X_{i} = 0 | X_{i}^{*}, e_{a})

$P(X_i=0|X_i^*,e_a)$ . Que hacer

P (X_{i} | . . .)

$P(X_i|...)$ , Creo que necesitas ambos

e_{r}

$e_r$ y

e_{a}

$e_a$

Eponymous

Lo siento, asumí

e_{r} = e_{a}

$e_r=e_a$ en este problema, por lo que habrá que cambiarlo. También escribí la hipótesis al revés (lo nulo debería ser

p = 0

$p=0$ , pero eso también se cambia fácilmente.

Zachary Blumenfeld

¿Todas las bolas de la urna son del mismo color (cuando no se pueden ver con claridad)

Respuestas: