Dado que el software puede hacer el cálculo exacto de la prueba de Fisher con tanta facilidad hoy en día , ¿hay alguna circunstancia en la que, teórica o prácticamente, la prueba de ji cuadrado sea realmente preferible a la prueba exacta de Fisher?
Las ventajas de la prueba exacta de Fisher incluyen:
- escalar a tablas de contingencia mayores de 2x2 (es decir, cualquier tabla r x c )
- da un valor p exacto
- no necesita tener un recuento mínimo de células esperado para ser válido
chi-squared
contingency-tables
fishers-exact
pmgjones
fuente
fuente
Respuestas:
Puedes cambiar la pregunta. Dado que la prueba ordinaria Pearson es casi siempre más precisa que la prueba exacta de Fisher y es mucho más rápida de calcular, ¿por qué alguien usa la prueba de Fisher?χ2
Tenga en cuenta que es una falacia que las frecuencias de celda esperadas tengan que exceder 5 para que el Pearson produzca valores precisos . La prueba es precisa siempre que las frecuencias de celda esperadas excedan 1.0 si se aplica una corrección muy simple a la estadística de prueba.χ2 P N−1N
De R-help, 2009 :
... la última edición del libro de Armitage recomienda que los ajustes de continuidad nunca se usen para las pruebas de chi-cuadrado de la tabla de contingencia;
E. Modificación de Pearson de la prueba de chi-cuadrado de Pearson, que difiere del original por un factor de (N-1) / N;
Cochran señaló que el número 5 en "frecuencia esperada inferior a 5" era arbitrario;
Los resultados de los estudios publicados se pueden resumir de la siguiente manera para los ensayos comparativos:
La prueba de ji cuadrado de Yate tiene tasas de error tipo I menores que las nominales, a menudo menos de la mitad de las nominales;
La prueba de Fisher-Irwin tiene tasas de error tipo I inferiores a las nominales;
La versión de K Pearson de la prueba de chi-cuadrado tiene tasas de error tipo I más cercanas a la nominal que la prueba de chi-cuadrado de Yate y la prueba de Fisher-Irwin, pero en algunas situaciones da errores de tipo I apreciablemente más grandes que el valor nominal;
La prueba de chi-cuadrado 'N-1' se comporta como la versión 'N' de K. Pearson, pero se reduce la tendencia a valores superiores a los nominales;
La prueba de Fisher-Irwin de dos lados que usa la regla de Irwin es menos conservadora que el método que duplica la probabilidad unilateral;
La prueba de Fisher-Irwin a mitad de P al duplicar la probabilidad unilateral se desempeña mejor que las versiones estándar de la prueba de Fisher-Irwin, y el método de P a mitad de la regla de Irwin funciona aún mejor al tener errores reales de tipo I más cercanos a los niveles nominales. ";
fuerte apoyo para la prueba 'N-1' siempre que las frecuencias esperadas excedan 1;
falla en la prueba de Fisher que se basó en la premisa de Fisher de que los totales marginales no contienen información útil;
demostración de su información útil en muestras muy pequeñas;
El ajuste de continuidad de Yate de N / 2 es una gran corrección excesiva y es inapropiado;
existen argumentos contrarios al uso de pruebas de aleatorización en ensayos aleatorizados;
cálculos de los peores casos;
recomendación general : use la prueba de chi-cuadrado 'N-1' cuando todas las frecuencias esperadas sean al menos 1, de lo contrario use la prueba de Fisher-Irwin usando la regla de Irwin para pruebas de dos lados, tomando tablas de la cola como sea probable, o menos, como eso observó; ver carta al editor de Antonio Andrés y respuesta del autor en 27: 1791-1796; 2008
... primer artículo para cuantificar verdaderamente la conservaduría de la prueba de Fisher;
"el tamaño de la prueba de FET fue inferior a 0.035 para casi todos los tamaños de muestra antes de 50 y no se acercó a 0.05 incluso para tamaños de muestra superiores a 100".
conservadurismo de los métodos "exactos";
ver Stat en Med 28 : 173-179, 2009 para una crítica sin respuesta
... La prueba exacta de Fisher nunca debe usarse a menos que se aplique la corrección de media ;P
valor de las pruebas incondicionales;
ver carta al editor 30: 890-891; 2011
fuente
Esta es una gran pregunta.
La prueba exacta de Fisher es uno de los grandes ejemplos del uso inteligente del diseño experimental de Fisher , junto con el condicionamiento de los datos (básicamente en tablas con la fila observada y los totales marginales) y su ingenio para encontrar distribuciones de probabilidad (aunque este no es el mejor ejemplo , para un mejor ejemplo ver aquí ). El uso de computadoras para calcular valores p "exactos" definitivamente ha ayudado a obtener respuestas precisas.
Sin embargo, es difícil justificar los supuestos de la prueba exacta de Fisher en la práctica. Debido a que el llamado "exacto" proviene del hecho de que en el "experimento de degustación de té" o en el caso de tablas de contingencia 2x2, el total de la fila y el total de la columna, es decir, los totales marginales se fijan por diseño. Esta suposición rara vez se justifica en la práctica. Para buenas referencias ver aquí .
El nombre "exacto" lleva a uno a creer que los valores p dados por esta prueba son exactos, lo que desafortunadamente en la mayoría de los casos no es correcto debido a estas razones.
En la mayoría de los casos prácticos, el uso de una prueba de razón de probabilidad o prueba de Chi-cuadrado no debería dar respuestas muy diferentes (valor p) de una prueba exacta de Fisher. Sí, cuando los márgenes son fijos, la prueba exacta de Fisher es una mejor opción, pero esto sucederá raramente. Por lo tanto, siempre se recomienda el uso de la prueba de Chi-cuadrado de la razón de probabilidad para las comprobaciones de consistencia.
Se aplican ideas similares cuando la prueba exacta de Fisher se generaliza a cualquier tabla, lo que básicamente equivale a calcular probabilidades hipergeométricas multivariadas. Por lo tanto, siempre se debe tratar de calcular los valores p basados en la distribución de Chi-cuadrado y la razón de probabilidad, además de los valores p "exactos".
fuente