Prueba post-hoc para la prueba de bondad de ajuste de chi-cuadrado

16

Estoy realizando una prueba de bondad de ajuste de chi-cuadrado (GOF) con tres categorías y específicamente quiero probar la nula de que las proporciones de población en cada categoría son iguales (es decir, la proporción es 1/3 en cada grupo):

                DATOS OBSERVADOS
Grupo 1     Grupo 2     Grupo 3     Total
  686 928 1012 2626

Por lo tanto, para esta prueba GOF, los recuentos esperados son 2626 (1/3) = 875.333 y la prueba arroja un valor p altamente significativo de <0.0001.

Ahora, es obvio que el Grupo 1 es significativamente diferente de 2 y 3, y es poco probable que 2 y 3 sean significativamente diferentes. Sin embargo, si quisiera probar todo esto formalmente y poder proporcionar un valor p para cada caso, ¿cuál sería el método apropiado?

He buscado en línea y parece que hay opiniones diferentes, pero sin documentación formal. Me pregunto si hay un texto o un documento revisado por pares que aborde esto.

Lo que me parece razonable es, a la luz de la prueba general significativa, hacer pruebas z para la diferencia en cada par de proporciones, posiblemente con una corrección del valor (tal vez Bonferroni, por ejemplo).α

Meg
fuente
Las pruebas t no serían adecuadas. Podrías hacer pruebas de bondad de ajuste por pares (pruebas de proporciones). ¿Qué opiniones diferentes encontraste?
Glen_b -Reinstale a Mónica el
Lo siento, quise decir prueba z (para diferencia en dos proporciones). Lo editaré
Meg
Este enlace dice agrupar todos los otros grupos versus el de interés (es para la prueba exacta de Fisher, pero este enlace se redirige desde otro enlace sobre el chi-cuadrado, donde el autor dice que aplique el mismo método para el chi-cuadrado en cuanto a la exacta de Fisher): biostathandbook.com/exactgof.html#posthoc Pero esto no es realmente lo que quiero, quiero pares, no un grupo contra todos los demás.
Meg
1
La mayoría de las otras fuentes que encuentro hablan sobre una configuración de tabla de contingencia, no una prueba GOF.
Meg
Sí, puede hacer pruebas de proporciones (ya sea como prueba z de una muestra o prueba binomial, o prueba de chi-cuadrado) de cada comparación por pares. No es necesario hacer comparaciones uno contra todos.
Glen_b -Reinstalar Monica

Respuestas:

8

Para mi sorpresa, un par de búsquedas no parecieron dar lugar a una discusión previa de post hoc para la bondad del ajuste; Espero que haya probablemente uno aquí en alguna parte, pero como no puedo localizarlo fácilmente, creo que es razonable convertir mis comentarios en una respuesta, para que las personas puedan al menos encontrar este usando los mismos términos de búsqueda que acabo de usar.

Las comparaciones por pares que busca hacer (con la condición de solo comparar los dos grupos involucrados) son razonables.

Esto equivale a tomar pares de grupos y probar si la proporción en uno de los grupos difiere de 1/2 (una prueba de proporciones de una muestra). Esto, como sugiere, se puede hacer como una prueba z (aunque la prueba binomial y la bondad de ajuste de chi-cuadrado también funcionarían).

Muchos de los enfoques habituales para tratar con la tasa de error general de tipo I deberían funcionar aquí (incluido Bonferroni, junto con los problemas habituales que pueden venir con él).

Glen_b -Reinstate a Monica
fuente
Gracias por tu consejo y por publicar como respuesta. Yo también estaba un poco sorprendido de que este problema aparentemente no haya surgido para el caso del GOF.
Meg
1
También me sorprendió, ya que este tema no se discute. Llegué a la misma solución que Glen, pero aún tengo dudas. Primero, cada par no es independiente de la muestra "global". Por ejemplo, imagine que tenemos 70,16,14, por lo que sugiere comparar 16 y 14 con 15/15. Sin embargo, en otra observación podría ser 72,14,14. es decir, la fuente de "superioridad" en el par podría no ser una contraparte en el par. Segundo, ¿deberíamos aplicar algún ajuste grupal como Bonferroni si las opciones no fueran realmente independientes? Tercero, ¿deberíamos distinguir si la opción era mutuamente excluyente o fue una opción múltiple?
Niksr
Tengo curiosidad, ¿podría ser posible emplear Cochran Q-test con McNemar post-hoc para este propósito? Parece que se cumplen todas las condiciones para esta prueba: 1) etapa de control - distribución uniforme 2) evento - reacción en estímulos 3) esta es comparación de pares (entre elección aleatoria hipotética y elección real) 4) nulo - la reacción en estímulo es diferente de aleatoria
Niksr
so you suggest compare 16 and 14 against 15/15@Niksr, no. Glen compara los dos grupos como 50/50porcentaje. El tercer grupo está excluido de la comparación.
ttnphns
Sí, quise decir que 16 y 14 son casos, no porcentajes.
Niksr
3

Tuve el mismo problema (y me alegró encontrar esta publicación). Ahora también encontré una breve nota sobre el tema en Sheskin (2003: 225) que solo quería compartir:

"Otro tipo de comparación que se puede realizar es contrastar solo dos de las seis celdas originales entre sí. Específicamente, supongamos que queremos comparar la Celda l / lunes con la Celda 2 / martes [...] Tenga en cuenta que en el ejemplo anterior, dado que empleamos solo dos celdas, la probabilidad para cada celda será π_i = 1/2. La frecuencia esperada de cada celda se obtiene multiplicando π_i = 1/2 por el número total de observaciones en las dos celdas (que es igual a 34). Como se señaló anteriormente, al realizar una comparación como la anterior, una cuestión crítica que el investigador debe abordar es qué valor de alfa emplear para evaluar la hipótesis nula ".

Sheskin, DJ 2003. Manual de procedimientos estadísticos paramétricos y no paramétricos: tercera edición. CRC Press.

Karen
fuente