Determinación del tamaño de la muestra con una distribución proporcional y binomial

10

Estoy tratando de aprender algunas estadísticas usando el libro, Biometry de Sokal y Rohlf (3e). Este es un ejercicio en el quinto capítulo que cubre la probabilidad, la distribución binomial y la distribución de Poisson. ingrese la descripción de la imagen aquí

Me doy cuenta de que hay una fórmula para producir una respuesta a esta pregunta: Sin embargo, esta ecuación no está en este texto. Me gustaría saber cómo calcular el tamaño de la muestra conociendo solo la probabilidad, el nivel de confianza deseado y la distribución binomial. ¿Hay algún recurso que cubra este tema que me pueda señalar? He probado Google, pero lo que he visto hasta ahora requiere información a la que no tengo acceso en este problema.

norte=4 4(pag-q)2
desconcertado
fuente
1
¿Quieres que te guíen en un viaje para descubrir la respuesta o prefieres que solo te den la respuesta, junto con una explicación de por qué es la respuesta?
jbowman
2
Un viaje suena bien. Esto no es para una clase y la respuesta se da al final de la pregunta. No me importa solo saber la respuesta, ¡ya lo sé! Tomé un curso de estadísticas hace muchos años, pero no lo aprecié lo suficiente. Estoy tratando de remediar eso ahora y realmente empiezo a entender los patrones subyacentes. Agradecería la ayuda. Este problema en particular no parece encajar con los demás de esta sección y un enfoque adecuado no está claramente demostrado (para mí) a partir de la información del texto sobre la distribución binomial ni de sus ejemplos dados.
desconcertado el
1
Estaría muy interesado en leer una respuesta detallada (con punteros a lecturas adicionales cuando sea necesario) a esta pregunta.
Zhubarb
2
Consideremos un ejemplo simple y concreto; Tiene 5 diapositivas de una persona que tiene el patógeno. ¿Cuál es la probabilidad de que no identifiques correctamente a esta persona como patógena? Una suposición oculta es que la presencia / ausencia del patógeno en un portaobjetos es independiente de la presencia / ausencia del patógeno en otros portaobjetos tomados de la misma muestra.
jbowman
1
Esa sería la probabilidad de obtener 5 falsos negativos seguidos:
desconcertado el

Respuestas:

8

Esa sería la probabilidad de obtener un falso negativo en 5 diapositivas:

(0.80) ^ 5 = 0.32768

Ahhh, entonces para disminuir la probabilidad de falsos negativos por debajo del 1% puedes hacer:

> x <- matrix(c(0), nrow=25)
> for(i in 1:25) x[i] = (0.8)^i
> x
             [,1]
 [1,] 0.800000000
 [2,] 0.640000000
 [3,] 0.512000000
 [4,] 0.409600000
 [5,] 0.327680000
 [6,] 0.262144000
 [7,] 0.209715200
 [8,] 0.167772160
 [9,] 0.134217728
 [10,] 0.107374182
 [11,] 0.085899346
 [12,] 0.068719477
 [13,] 0.054975581
 [14,] 0.043980465
 [15,] 0.035184372
 [16,] 0.028147498
 [17,] 0.022517998
 [18,] 0.018014399
 [19,] 0.014411519
 [20,] 0.011529215
 [21,] 0.009223372
 [22,] 0.007378698
 [23,] 0.005902958
 [24,] 0.004722366
 [25,] 0.003777893

Y encuentre que la tasa de falsos positivos es inferior al 1% en i = 21.

¡Excelente! Gracias. No puedo creer que no haya visto eso. Estaba probando todo tipo de probabilidades condicionales y tal por alguna razón. Mantenlo simple, estúpido ...

desconcertado
fuente
1
Sí, a veces los problemas más fáciles son los más difíciles.
jbowman