Estoy realizando una prueba de bondad de ajuste de chi-cuadrado (GOF) con tres categorías y específicamente quiero probar la nula de que las proporciones de población en cada categoría son iguales (es decir, la proporción es 1/3 en cada grupo):
DATOS OBSERVADOS
Grupo 1 Grupo 2 Grupo 3 Total
686 928 1012 2626
Por lo tanto, para esta prueba GOF, los recuentos esperados son 2626 (1/3) = 875.333 y la prueba arroja un valor p altamente significativo de <0.0001.
Ahora, es obvio que el Grupo 1 es significativamente diferente de 2 y 3, y es poco probable que 2 y 3 sean significativamente diferentes. Sin embargo, si quisiera probar todo esto formalmente y poder proporcionar un valor p para cada caso, ¿cuál sería el método apropiado?
He buscado en línea y parece que hay opiniones diferentes, pero sin documentación formal. Me pregunto si hay un texto o un documento revisado por pares que aborde esto.
Lo que me parece razonable es, a la luz de la prueba general significativa, hacer pruebas z para la diferencia en cada par de proporciones, posiblemente con una corrección del valor (tal vez Bonferroni, por ejemplo).
Respuestas:
Para mi sorpresa, un par de búsquedas no parecieron dar lugar a una discusión previa de post hoc para la bondad del ajuste; Espero que haya probablemente uno aquí en alguna parte, pero como no puedo localizarlo fácilmente, creo que es razonable convertir mis comentarios en una respuesta, para que las personas puedan al menos encontrar este usando los mismos términos de búsqueda que acabo de usar.
Las comparaciones por pares que busca hacer (con la condición de solo comparar los dos grupos involucrados) son razonables.
Esto equivale a tomar pares de grupos y probar si la proporción en uno de los grupos difiere de 1/2 (una prueba de proporciones de una muestra). Esto, como sugiere, se puede hacer como una prueba z (aunque la prueba binomial y la bondad de ajuste de chi-cuadrado también funcionarían).
Muchos de los enfoques habituales para tratar con la tasa de error general de tipo I deberían funcionar aquí (incluido Bonferroni, junto con los problemas habituales que pueden venir con él).
fuente
so you suggest compare 16 and 14 against 15/15
@Niksr, no. Glen compara los dos grupos como50/50
porcentaje. El tercer grupo está excluido de la comparación.Tuve el mismo problema (y me alegró encontrar esta publicación). Ahora también encontré una breve nota sobre el tema en Sheskin (2003: 225) que solo quería compartir:
"Otro tipo de comparación que se puede realizar es contrastar solo dos de las seis celdas originales entre sí. Específicamente, supongamos que queremos comparar la Celda l / lunes con la Celda 2 / martes [...] Tenga en cuenta que en el ejemplo anterior, dado que empleamos solo dos celdas, la probabilidad para cada celda será π_i = 1/2. La frecuencia esperada de cada celda se obtiene multiplicando π_i = 1/2 por el número total de observaciones en las dos celdas (que es igual a 34). Como se señaló anteriormente, al realizar una comparación como la anterior, una cuestión crítica que el investigador debe abordar es qué valor de alfa emplear para evaluar la hipótesis nula ".
Sheskin, DJ 2003. Manual de procedimientos estadísticos paramétricos y no paramétricos: tercera edición. CRC Press.
fuente