¿Qué distribución asume la prueba exacta de Fisher?

11

En mi trabajo, he visto varios usos de la prueba exacta de Fisher, y me preguntaba qué tan bien se ajustan a mis datos. Mirando varias fuentes, entendí cómo calcular la estadística, pero nunca vi una explicación clara y formal de la hipótesis nula supuesta.

¿Puede alguien explicarme o referirme a una explicación formal de la distribución asumida? Agradecería una explicación en términos de los valores en la tabla de contingencia.

Amit Lavon
fuente
3
En el caso 2x2 se basa en la distribución hipergeométrica.
Glen_b -Reinstalar a Mónica el

Respuestas:

11

2×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1X1+X2ψ=θ11θ1θ21θ2ψ=1

Esta distribución tiene su página de Wikipedia .

Para evaluarlo con R, simplemente puede usar la fórmula que define la probabilidad condicional:

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

O use la dnoncenhypergeomfunción del MCMCpackpaquete:

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838
Stéphane Laurent
fuente
Gracias @Stephane. ¿Puede explicar más por qué se vuelve hipergeométrica y cuáles son los parámetros?
Amit Lavon
2
Lo siento @AmitLavon, no conozco los detalles sobre esta distribución hipergeométrica.
Stéphane Laurent
1
@AmitLavon Acabo de editar mi respuesta para incluir el enlace a wikipedia y el código R.
Stéphane Laurent
10

χ2

  • Las dos variables que se evalúan para la asociación son variables verdaderamente politomáticas de todo o nada, como Estados Unidos / Europa muertos / vivos. Si una o ambas variables son una simplificación de un continuo subyacente, el análisis de datos categóricos no debe realizarse en absoluto.
  • YXYY=yXxYX2×2La prueba de la tabla de contenido supone que cada sujeto en tratamiento A tiene la misma probabilidad de muerte. [Se podría argumentar que esta es una suposición demasiado estricta, pero esa posición no reconoce la pérdida de poder por hacer pruebas de asociación no ajustadas].

χ2XYYPPχ2 P

Frank Harrell
fuente
Gracias @FrankHarrell. ¿Puede dar referencias para su afirmación sobre que los valores P de chi-cuadrado son más precisos que los de Fisher?
Amit Lavon
1
Ver por ejemplo citeulike.org/user/harrelfe/tag/fishers-exact-test . Esto se ha discutido extensamente en stackexchange.
Frank Harrell
lamentablemente, ctiteulike se ha ido y web.archive.org solo parece haber rastreado la primera página de la cuenta de harrelfe.
Glen_b -Reinstala Monica