La corrección de continuidad de Yates en el intervalo de confianza devuelta por la prueba de prop.

8

Este es el intervalo de confianza estimado por prop.test

n <- 600; x <- 276; p <- 0.40
prop.test(x, n, p, alternative="two.sided", conf.level=0.95, correct=T)
95 percent confidence interval:
 0.4196787 0.5008409 

Traté de reproducirlo, leyendo el código bajo prop.test. Aquí hay una forma simplificada de obtener esos dos límites

ESTIMATE <- x/n
YATES <- 0.5
conf.level <- 0.95
z <- qnorm((1 + conf.level)/2)
YATES <- min(YATES, abs(x - n * p)) 
z22n <- z^2/(2 * n)
p.c <- ESTIMATE + YATES/n
(p.c + z22n + z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.5008409
p.c <- ESTIMATE - YATES/n
(p.c + z22n - z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.4196787

¿Puede explicarme por qué la probabilidad subyacente de éxito (p) se utiliza en la línea 5? o tal vez podría sugerir dónde puedo encontrar más información sobre esta corrección de YATES que afecta a ESTIMATE.

Gracias

George Dontas
fuente

Respuestas:

3

La página de ayuda indica que "la corrección de continuidad se usa solo si no supera la diferencia entre la muestra y las proporciones nulas en valor absoluto". Esto es lo que está comprobando la línea 5: x/nes la proporción empírica, pes la proporción nula. (En realidad, me parece un poco "engañoso", ya que es más un "en la medida en que no excede" al mirar la línea 5).

lince
fuente
7

En la segunda pregunta de dónde puede encontrar más información sobre esta corrección de continuidad (atribuida a Yates en la ayuda prop.testpero no en las referencias a continuación, creo que Yates propuso originalmente una corrección de continuidad solo a la prueba de chi-cuadrado para tablas de contingencia ) :

  1. Newcombe RG. Intervalos de confianza de dos lados para la proporción única: comparación de siete métodos. Stat Med 1998; 17 (8): 857-872. PMID: 9595616

  2. Brown LD, Cai TT, DasGupta A. Estimación del intervalo para una proporción binomial (con comentarios y réplica). Ciencia Estadística 2001; 16 (2): 101-133. doi: 10.1214 / ss / 1009213286

El intervalo de puntuación de Wilson con corrección de continuidad es el 'método 4' en Newcomb. Brown y col. considere solo el intervalo de puntuación de Wilson no corregido en el texto principal, pero George Casella sugiere usar la versión con corrección de continuidad en su Comentario (p121), que Brown et al. discuta en su Dúplica (p130):

Casella sugiere la posibilidad de realizar una corrección de continuidad en el estadístico de puntaje antes de construir un intervalo de confianza. No estamos de acuerdo con esta propuesta desde ninguna perspectiva. Estos intervalos de "Wilson con corrección de continuidad" tienen propiedades de cobertura extremadamente conservadoras, aunque en principio no se garantiza que sean conservadores en todas partes. Pero incluso si el objetivo de uno, a diferencia del nuestro, es producir intervalos conservadores, estos intervalos serán muy ineficientes en su nivel normal en relación con Blyth-Still o incluso Clopper-Pearson.

El intervalo "exacto" de Clopper-Pearson se proporciona binom.testen R. Sugeriría usar eso en lugar de prop.testsi desea un intervalo conservador, es decir, uno que garantice al menos un 95% de cobertura. Si prefiere un intervalo que tenga una cobertura cercana al 95% en promedio (por encima de p) y, por lo tanto, a menudo sea más estrecho, puede usar prop.test(…, correct=FALSE)para dar el intervalo de puntuación de Wilson no corregido.

El libro de texto estándar para tales asuntos es Métodos estadísticos de Fleiss para tasas y proporciones . Newcomb hace referencia a la edición original de 1981, pero la última edición es la tercera (2003) . Sin embargo, no lo he comprobado yo mismo.

una parada
fuente
2
Otra referencia para la comparación de los IC binomiales es Brown LD, Cai TT y DasGupta, A. (2001). Estimación de intervalo para una proporción binomial. Ciencia estadística, 16 (2), 101-133. projecteuclid.org/euclid.ss/1009213286 (acceso abierto). El binompaquete de R también tiene el CI Agresti-Coull.
caracal