¿Cuál es la relación entre una prueba de chi cuadrado y una prueba de proporciones iguales?

52

Supongamos que tengo tres poblaciones con cuatro características mutuamente excluyentes. Tomo muestras aleatorias de cada población y construyo una tabla cruzada o tabla de frecuencias para las características que estoy midiendo. ¿Estoy en lo cierto al decir que:

  1. Si quisiera probar si existe alguna relación entre las poblaciones y las características (por ejemplo, si una población tiene una frecuencia más alta de una de las características), debería realizar una prueba de ji cuadrado y ver si el resultado es significativo.

  2. Si la prueba de ji cuadrado es significativa, solo me muestra que hay alguna relación entre las poblaciones y las características, pero no cómo están relacionadas.

  3. Además, no todas las características deben estar relacionadas con la población. Por ejemplo, si las diferentes poblaciones tienen distribuciones significativamente diferentes de las características A y B, pero no de C y D, entonces la prueba de ji cuadrado puede volver a ser significativa.

  4. Si quisiera medir si la población afecta o no a una característica específica, entonces puedo realizar una prueba para proporciones iguales (he visto que esto se llama prueba z, o como prop.test()en R) solo en esa característica.

En otras palabras, ¿es apropiado usar el prop.test()para determinar con mayor precisión la naturaleza de una relación entre dos conjuntos de categorías cuando la prueba de chi-cuadrado dice que hay una relación significativa?

hgcrpd
fuente
Lea también: stats.stackexchange.com/q/173415/3277 .
ttnphns

Respuestas:

23

Respuesta muy corta:

La prueba de chi-cuadrado ( chisq.test()en R) compara las frecuencias observadas en cada categoría de una tabla de contingencia con las frecuencias esperadas (calculadas como el producto de las frecuencias marginales). Se utiliza para determinar si las desviaciones entre los conteos observados y los esperados son demasiado grandes para atribuirlos al azar. La salida de la independencia se verifica fácilmente inspeccionando los residuos (pruebe ?mosaicploto ?assocplot, pero también mire el vcdpaquete). Úselo fisher.test()para una prueba exacta (basándose en la distribución hipergeométrica).

La prop.test()función en R permite comprobar si las proporciones son comparables entre grupos o no difieren de las probabilidades teóricas. Se le conoce como prueba porque la estadística de prueba se ve así:z

z=(F1-F2)pags^(1-pags^)(1norte1+1norte2)

donde p = ( p 1 + p 2 ) / ( n 1 + n 2 ) , y los índices ( 1 , 2 ) se refieren a la primera y segunda línea de la tabla. En una tabla de contingencia bidireccional donde H 0 :pags^=(pags1+pags2)/ /(norte1+norte2)(1,2)H0 0:pags1=pags2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

Para el análisis de datos discretos con R, recomiendo encarecidamente el Manual R (y S-PLUS) para el Análisis de datos categóricos de Agresti (2002) , de Laura Thompson.

chl
fuente
2
¿Existe un nombre común para la prueba que realiza prop.test ()?
Atticus29
2
"Se conoce como una prueba z".
russellpierce
@chl Estoy un poco confundido: pensé prop.testy chisq.testambos usan el chi-cuadrado, lo que explicaría los valores p idénticos, así como también por qué en esta publicación en R-Bloggers tienen su propia función ad hoc.
Antoni Parellada
@ Antoni Sí, esto es lo que Keith explicó en su respuesta.
chl
3
norte1norte2F1F2pags1pags2
23

zpags

α

α

La prueba más poderosa para la igualdad de proporciones se llama prueba de Barnard para la superioridad .

Keith Winstein
fuente
@gung Estoy un poco confundido: pensé prop.testy chisq.testambos usan el chi-cuadrado, lo que explicaría los valores p idénticos, así como por qué en esta publicación en R-Bloggers tienen su propia función ad hoc.
Antoni Parellada
No entiendo lo que te confunde, @AntoniParellada. Esta respuesta dice que son "exactamente iguales", lo que tiene sentido si "ambos usan el chi-cuadrado".
gung - Restablece a Monica
@gung en la respuesta original chl afirma que prop.test()... se conoce como una prueba z en contraposición a chisq.test(). Más tarde, Keith dice: "Una prueba de chi-cuadrado para la igualdad de dos proporciones es exactamente lo mismo que una prueba z. (Es por eso que @chl obtiene exactamente el mismo valor p con ambas pruebas)"
Antoni Parellada
1
Eso parece ser solo una frase infelicita, @AntoniParellada. Conceptualmente, las 2 pruebas son distintas, que es lo que discutí en mi otra respuesta que viste. Pero matemáticamente, son equivalentes. De hecho, creo que la función R en prop.test()realidad solo llama chisq.test()e imprime la salida de manera diferente.
gung - Restablece a Monica
@gung He estado trabajando en una función similar a R-Bloggers e iba a hacer una publicación para personas en mi nivel de principiante, citando de hecho algunos conceptos clave que has escrito, revisando las matemáticas tanto para el chi cuadrado y prueba z, y luego da el código R.
Antoni Parellada