Prueba de Fisher en R

10

Supongamos que tenemos el siguiente conjunto de datos:

                Men    Women    
Dieting         10      30
Non-dieting     5       60

Si ejecuto la prueba exacta de Fisher en R, ¿qué implica alternative = greater(o menos)? Por ejemplo:

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

Tengo el p-value = 0.01588y odds ratio = 3.943534. Además, cuando volteo las filas de la tabla de contingencia así:

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

entonces consigo el p-value = 0.9967y odds ratio = 0.2535796. Pero, cuando ejecuto las dos tablas de contingencia sin el argumento alternativo (es decir fisher.test(mat)), obtengo el p-value = 0.02063.

  1. ¿Podría por favor explicarme la razón?
  2. Además, ¿cuál es la hipótesis nula y la hipótesis alternativa en los casos anteriores?
  3. ¿Puedo ejecutar la prueba de Fisher en una tabla de contingencia como esta:

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

PD: no soy un estadístico. Estoy tratando de aprender estadísticas para que su ayuda (respuestas en inglés simple) sea muy apreciada.

Snape
fuente

Respuestas:

11

greater(o less) se refiere a una prueba unilateral que compara una hipótesis nula p1=p2con la alternativa p1>p2(o p1<p2). En contraste, una prueba de dos lados compara las hipótesis nulas con la alternativa que p1no es igual a p2.

Para su tabla, la proporción de personas que hacen dieta que son hombres es 1/4 = 0.25 (10 de 40) en su muestra. Por otro lado, la proporción de personas que no hacen dieta que son hombres es 1/13 o (5 de 65) igual a 0.077 en la muestra. Entonces, la estimación para p1es 0.25 y para p2es 0.077. Por lo tanto, parece que p1>p2.

Es por eso que para la alternativa unilateral, p1>p2el valor p es 0.01588. (Los valores p pequeños indican que la hipótesis nula es poco probable y que la alternativa es probable).

Cuando la alternativa es p1<p2que vemos que sus datos indican que la diferencia está en la dirección incorrecta (o no anticipada).

Es por eso que en ese caso el valor p es tan alto 0.9967. Para la alternativa de dos lados, el valor p debería ser un poco más alto que para la alternativa de un lado p1>p2. Y de hecho, es con un valor p igual a 0.02063.

Michael R. Chernick
fuente
Fantástica explicación. Entonces, ¿la prueba exacta de Fisher en realidad compara las probabilidades entre filas en lugar de columnas?
Christian