Análisis de potencia para datos binomiales cuando la hipótesis nula es que

10

Me gustaría hacer un análisis de potencia para una sola muestra de datos binomiales, con , frente a , donde es la proporción de éxitos en la población. Si , podría usar la aproximación normal al binomio o la , pero con , ambos fallan. Me encantaría saber si hay una manera de hacer este análisis. Agradecería mucho cualquier sugerencia, comentario o referencia. ¡Muchas gracias!H0:p=0H1:p=0.001p0<p<1χ2p=0

usuario765195
fuente
Entonces, ¿por qué no utiliza la prueba exacta de Clopper-Pearson?
Stéphane Laurent
2
¡Espero que tengas una muestra realmente grande! Esto va a ser difícil de probar.
Peter Flom - Restablece a Monica

Respuestas:

13

Tiene una hipótesis alternativa exacta unilateral donde y . p 1 = 0.001 p 0 = 0p1>p0p1=0.001p0=0

  • El primer paso es identificar un umbral para el número de éxitos, de modo que la probabilidad de obtener al menos éxitos en una muestra de tamaño sea ​​muy baja bajo la hipótesis nula (convencionalmente ). En su caso, , independientemente de su elección particular para y .ccnα=0.05c=1n1α>0
  • El segundo paso es averiguar la probabilidad de obtener al menos éxitos en una muestra de tamaño bajo la hipótesis alternativa: este es su poder. Aquí, necesita una fija tal que la distribución binomial esté completamente especificada.cnnB(n,p1)

El segundo paso en R con :n=500

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

Para tener una idea de cómo cambia la potencia con el tamaño de la muestra, puede dibujar una función de potencia: ingrese la descripción de la imagen aquí

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

Si desea saber qué tamaño de muestra necesita para alcanzar al menos una potencia especificada previamente, puede usar los valores de potencia calculados anteriormente. Digamos que quieres un poder de al menos .0.5

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

Por lo tanto, necesita un tamaño de muestra de al menos para lograr una potencia de .6930.5

lince
fuente
Según pwr.p.test, para una potencia de 0.5, necesita al menos 677 observaciones. ¡Pero potencia = 0.5 es muy baja!
Jessica
@caracal ¿Está utilizando una aproximación normal para obtener su curva de potencia? Una función de poder binomial exacta no sería tan suave. En realidad, tiene dientes de sierra, lo que se puede ver si el eje del tamaño de la muestra se amplía. Discuto esto en mi artículo de 2002 en el Estadístico estadounidense en coautoría con Christine Liu. Además, el binomio está tan sesgado a una p muy baja que n debe ser grande para que la aproximación normal funcione bien.
Michael R. Chernick
2
@MichaelChernick No, esto es de las distribuciones binomiales, no de una aproximación normal. Por supuesto, tiene razón en que, en general, el poder para una prueba binomial es una función de diente de sierra que no es monótona. Pero tenga en cuenta que tenemos un caso especial aquí con . Esto significa que la región de aceptación para la hipótesis alternativa siempre comienza en 1, independientemente de . Con un umbral constante , una constante , la potencia es una función estrictamente creciente de . p0=0nc=1p1=0.001n
Caracal
@Jessica Tenga en cuenta que pwr.p.test()utiliza una aproximación normal, no las distribuciones binomiales exactas. Simplemente escriba pwr.p.testpara echar un vistazo al código fuente. Encontrará las llamadas para pnorm()indicar que se utiliza una aproximación.
Caracal
1
@caracal Entonces, ¿puedo verlo de esta manera? Según la hipótesis nula, la probabilidad de éxito es 0, por lo tanto, si alguna vez ve un éxito, puede rechazar la hipótesis nula. ¡Es por eso que usted dice que el umbral es 1 porque si la suma binomial llega a 1, puede rechazar con un error tipo 2 de 0! Ahora, bajo la alternativa, la probabilidad del primer éxito en la enésima prueba es (1-p) p. Esta probabilidad va a 0 como n va al infinito. Entonces, una regla secuencial que se detiene cuando S = 1 tendría una potencia 1 para cualquier p> 0. n1n
Michael R. Chernick
3

Puede responder esta pregunta fácilmente con el pwrpaquete en R.

Deberá definir un nivel de significación, potencia y tamaño del efecto. Por lo general, el nivel de significancia se establece en 0.05 y la potencia se establece en 0.8. Un poder superior requerirá más observaciones. Un nivel de significancia más bajo disminuirá el poder.

El tamaño del efecto para las proporciones utilizadas en este paquete es la h de Cohen. El límite para una pequeña h a menudo se toma como 0,20. El límite real varía según la aplicación, y puede ser más pequeño en su caso. Menor h significa que se requerirán más observaciones. Dijiste que tu alternativa es . Eso es muy pequeñop=0.001

> ES.h(.001, 0)
[1] 0.0632561

Pero aún podemos proceder.

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

Con estos valores, necesita al menos 1546 observaciones.

Jessica
fuente
1

En su caso específico, existe una solución simple y exacta:

Bajo la hipótesis nula particular nunca se debe observar un éxito. Tan pronto como observe un éxito, puede estar seguro de que .H0:p=0p0

Bajo la alternativa El número de pruebas requeridas para observar al menos 1 éxito sigue una distribución geométrica. Entonces, para obtener el tamaño de muestra mínimo para lograr una potencia de , necesita encontrar la k más pequeña de manera que,H1:p=0.0011β

1β1(1p)(k1)

Entonces, con para obtener un potencia, necesitaría al menos 1610 muestras.p=0.00180

flotador
fuente
Al leer los comentarios a la solución 1, me doy cuenta de que esta es esencialmente la misma solución que se obtiene si se atiene a una. Sin embargo, nunca hace daño deletrear algunos resultados básicos de la teoría de probabilidad, sin la necesidad de llegar allí por intuición.
flotador