Tamaño de muestra para proporciones en medidas repetidas

9

Estoy tratando de ayudar a un científico a diseñar un estudio para la aparición de microbios de salmonella. Le gustaría comparar una formulación antimicrobiana experimental contra un cloro (lejía) en granjas avícolas. Debido a que las tasas de fondo de salmonella difieren con el tiempo, él planea medir el% de aves de corral con salmonella antes del tratamiento y después del tratamiento. Entonces, la medición será la diferencia de antes / después del% de salmonela para las fórmulas experimentales frente a las de cloro.

¿Alguien puede aconsejar sobre cómo estimar los tamaños de muestra necesarios? Digamos que la tasa de fondo es del 50%; después del blanqueador es 20%; y queremos detectar si la formulación experimental cambia la tasa en +/- 10%. gracias

EDITAR: con lo que estoy luchando es cómo incorporar las tasas de fondo. Llamémoslos p3 y p4, las tasas de salmonela "antes" para las muestras de cloro y experimentales, respectivamente. Entonces, la estadística a estimar es la diferencia de diferencias: Experimental (Después-Antes) - Blanqueador (Después-Antes) = (p0-p2) - (p3-p1). Para tener en cuenta la variación de muestreo de las tasas "anteriores" p2 y p3 en el cálculo del tamaño de la muestra, ¿es tan simple como usar p0 (1-p0) + p1 (1-p1) + p2 (1-p2) + p3 (1-p3) donde haya un término de variación en la ecuación de tamaño de muestra? Deje que todos los tamaños de las muestras sean iguales, n1 = n2 = n.

Paul
fuente
2
Es una gran pregunta La solución óptima dependerá de algunas cosas adicionales, que incluyen (a) los elementos principales del costo, incluido el costo de incluir una granja y el costo de medir un tema; y (b) el diseño experimental. Por ejemplo, ¿se aplicarán las soluciones de tratamiento y control en cada granja (una buena opción, pero no sin sus posibles problemas) o podrá aplicar solo una solución en cada granja? ¿Los sujetos se agruparán (físicamente) dentro de las granjas o serán tratados y muestreados verdaderamente al azar?
whuber
He integrado su respuesta de extensión en la pregunta.

Respuestas:

2

Tomemos una puñalada en una aproximación de primer orden suponiendo un muestreo aleatorio simple y una proporción constante de infección para cualquier tratamiento. Suponga que el tamaño de la muestra es lo suficientemente grande como para que se pueda usar una aproximación normal en una prueba de hipótesis sobre proporciones para que podamos calcular la estadística az de esta manera

z=ptp0p0(1p0)(1n1+1n2)

Este es el estadístico de muestra para una prueba de dos muestras, nueva fórmula versus lejía, ya que esperamos que el efecto de la lejía sea aleatorio, así como el efecto de la nueva fórmula.

Entonces deje , ya que los experimentos balanceados tienen la mayor potencia, y use sus especificaciones que , . Para lograr una estadística de prueba (error Tipo I de aproximadamente 5%), esto funciona a . Este es un tamaño de muestra razonable para que la aproximación normal funcione, pero definitivamente es un límite inferior.n=n1=n2|ptp0|0.1p0=0.2|z|2n128

Recomiendo hacer un cálculo similar basado en la potencia deseada para que la prueba controle el error Tipo II, ya que un diseño de baja potencia tiene una alta probabilidad de perder un efecto real.

Una vez que haya hecho todo este trabajo básico, comience a mirar las cosas que las direcciones de whuber . En particular, no está claro en su planteamiento del problema si las muestras de aves de corral medidas son diferentes grupos de sujetos o los mismos grupos de sujetos. Si son lo mismo, te gustan las pruebas t combinadas o el territorio de medidas repetidas, ¡y necesitas a alguien más inteligente que yo para que te ayude!

Mike Anderson
fuente
Buen comienzo (+1). La fórmula necesita algo de fijación. La varianza de la diferencia de las proporciones es igual a p0 (1-p0) / n0 + p1 (1-p1) / n1. Con n0 = n1 = ny p0 = .5, p1 = .2, eso es igual a 0.41 / n, lo que implica n = 41 z ^ 2. Tenga en cuenta también que esta es una prueba unilateral, por lo que z = 1.65 funciona bien. (Aquí se necesita cierta precisión porque el resultado es sensible a la cuadratura de z). Independientemente, estos cálculos establecen que aproximadamente 10 ^ 2 sujetos independientes necesitarán ser evaluados si este modelo es correcto. (Yo no esperar que el blanqueo o la nueva fórmula que tienen efectos "al azar".)
whuber
Mike Anderson y Whuber, gracias por sus sugerencias. Hiciste buenas preguntas, que intentaré responder. Las unidades experimentales de aves de corral serán aleatorias, no de grupos. A partir de ahora, el costo no es una consideración.
Paul