¿Por qué la prueba de McNemar usa chi-cuadrado y no la distribución normal?

11

Acabo de notar cómo la prueba de McNemar no exacta utiliza la distribución asintótica de chi cuadrado. Pero dado que la prueba exacta (para la tabla de dos casos) se basa en la distribución binomial, ¿por qué no es común sugerir la aproximación normal a la distribución binomial?

Gracias.

Tal Galili
fuente

Respuestas:

15

Una respuesta cercana a la intuitiva:

Eche un vistazo más de cerca a la fórmula para la prueba de McNemar, dada la tabla

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

La estadística de McNemar Mse calcula como:

M=(bc)2b+c

χ2bcb-cb+cMχ2


EDITAR: Como se indica correctamente, la aproximación normal es de hecho completamente equivalente. Eso es bastante trivial dado el argumento que usa la aproximación de b-cla distribución normal.

bBinom(b+c,0.5)N(0.5×(b+c),0.52×(b+c)

O equivalente:

b(b+c2)b+c2N(0,1)

que se simplifica a

bcb+cN(0,1)

Mχ12

χ2

Joris Meys
fuente
3
Así es. La conexión quizás se puede ver más claramente considerando Sqrt (M) = (bc) / Sqrt (b + c). Aproximando la varianza de b como b y la varianza de c como c (como es habitual con los datos contados), vemos que Sqrt (M) parece una variante aproximadamente normal (bc) dividida por su desviación estándar: en otras palabras, parece una variante normal estándar . De hecho, podríamos realizar una prueba equivalente al referir Sqrt (M) a una tabla de la distribución normal estándar. La cuadratura efectiva hace que la prueba sea simétrica de dos colas. Obviamente, esto se rompe si b o c es pequeño.
whuber
Gracias por la respuesta intuitiva Joris. Aún así, ¿por qué es más común usar esta aproximación en lugar de usar la aproximación normal a la prueba binomial exacta de McNemar?
Tal Galili el
@Tal: Es lo mismo. Ver respuesta sin parar y mi edición.
Joris Meys
En realidad, la última pregunta. Entonces, si ambos son idénticos (y creo que es posible que también necesite un "valor absoluto" alrededor de la CC), entonces ¿por qué las personas van a la distribución de chi en lugar de quedarse con la normal? ¿Dónde está la ventaja?
Tal Galili
1
@Tal: Sabes que R. traza el chi2 con un grado de libertad, verás.
Joris Meys
8

¿No llegarán los dos enfoques a lo mismo? La distribución de chi-cuadrado relevante tiene un grado de libertad, por lo que es simplemente la distribución del cuadrado de una variable aleatoria con una distribución normal estándar. Tendría que pasar por el álgebra para verificar, lo que no tengo tiempo para hacer en este momento, pero me sorprendería si no terminas exactamente con la misma respuesta en ambos sentidos.

una parada
fuente
vea mi respuesta para más detalles
Joris Meys
Hola onestop: dado que ambos son asintóticos, entonces para N's más pequeños pueden arrojar resultados algo diferentes. En tal caso, me pregunto si la elección de ir con chi-cuadrado es porque es mejor que la aproximación normal, o por razones históricas (o tal vez, como sugirió, siempre arrojan resultados idénticos)
Tal Galili
@Tal: para N más pequeño, ninguno de los dos se mantiene. Y como se muestra en mi edición, son exactamente lo mismo.
Joris Meys el