Prueba G vs prueba de chi cuadrado de Pearson

10

Estoy probando la independencia en una tabla de contingencia No sé si la prueba G o la prueba de ji cuadrado de Pearson es mejor. El tamaño de la muestra es de cientos, pero hay algunos recuentos bajos de células. Como se indica en la página de Wikipedia , la aproximación a la distribución de chi-cuadrado es mejor para la prueba G que para la prueba de chi-cuadrado de Pearson. Pero estoy usando la simulación de Monte Carlo para calcular el valor p, entonces, ¿hay alguna diferencia entre estas dos pruebas?N×M

oodkan
fuente
1
Ver Deviance vs Pearson bondad de ajuste .
Scortchi - Restablece a Monica

Respuestas:

8

Son asintóticamente iguales. Son solo formas diferentes de llegar a la misma idea. Más específicamente, la prueba de chi cuadrado de Pearson es una prueba de puntaje, mientras que la prueba G es una prueba de razón de probabilidad. Para tener una mejor idea de esas ideas, puede ayudarlo leer mi respuesta aquí: ¿Por qué mis valores p difieren entre la salida de regresión logística, la prueba de chi-cuadrado y el intervalo de confianza para el OR? Para responder a su pregunta directa, si está calculando el valor p mediante la simulación de Monte Carlo, no debería importar; puedes usar el que sea más conveniente para ti. Tenga en cuenta que no hay problema con recuentos bajos de células, solo se espera (potencialmente) bajorecuentos de células; Es posible tener recuentos bajos de células y tener recuentos esperados que estén bien. Además, ni los recuentos reales bajos ni los recuentos bajos esperados son importantes cuando el valor p se determina por simulación.

(Para lo que vale, probablemente usaría el chi-cuadrado de Pearson, porque R tiene una función conveniente para eso que incluye la opción de simular el valor p).

gung - Restablece a Monica
fuente
¿Cuál es la función en R?
llewmills
@llewmills, chisq.test.
gung - Restablece a Monica
1

Echa un vistazo a Rfast. https://cran.r-project.org/web/packages/Rfast/index.html Los comandos relevantes son g2Test_univariate (data, dc) g2Test_univariate_perm (data, dc, nperm) Los cálculos son extremadamente rápidos. Y en general prefieren la prueba G ^ 2 ya que el Chi-cuadrado es una aproximación a él.

Michail
fuente
-1

La prueba de ji cuadrado y la prueba G generalmente producen resultados similares. Pero lo más importante aquí es que debe elegir una de las dos pruebas y seguirla, no solo para su prueba mencionada, sino para futuras pruebas durante el curso de su investigación. Es aconsejable porque si intenta utilizar ambas pruebas indistintamente, es muy probable que aumente la posibilidad de obtener falsos positivos.

pequeño monstruo
fuente
2
¿Cuál es el razonamiento por el cual aumenta la afirmación de que aumenta la posibilidad de un falso positivo? (A menos que quisieras sugerir que la prueba se elige por referencia a los recuentos reales, pero es la referencia a los recuentos para elegir entre ellos ese es el problema, en lugar de la idea de intercambiar pruebas per se)
Glen_b -Reinstate Monica
2
@Glen_b La probabilidad de obtener falso positivo probablemente aumenta si elegimos un valor p de la prueba que sea más favorable a nuestras suposiciones (en caso de que intentemos ambas pruebas)
little_monster