(Para que nuestras nociones sean un poco más precisas, llamemos al 'estadístico de prueba' la distribución de lo que buscamos para calcular realmente el valor p. Esto significa que para una prueba t de dos colas, nuestro estadístico de prueba sería lugar de )El | TEl |T
Lo que es una prueba estadística que hace es inducir un ordenamiento en el espacio muestral (o más estrictamente, una ordenación parcial), de manera que pueda identificar los casos extremos (los más consistentes con la alternativa).
En el caso de la prueba exacta de Fisher, ya hay un orden en cierto sentido, que son las probabilidades de las distintas tablas de 2x2. Si llega el caso, que se corresponden con el pedido de en el sentido de que cualquiera de los valores más grandes o más pequeñas de son 'extremo' y son también los que tienen menor probabilidad. Entonces, en lugar de mirar los valores de en la forma que sugieres, uno simplemente puede trabajar desde los extremos grande y pequeño, en cada paso simplemente agregando el valor (el mayor o menorX1 , 1X1 , 1 X 1 , 1 X 1 , 1X1 , 1X1 , 1-valor aún no está allí) tiene la menor probabilidad asociada con él, continuando hasta llegar a la tabla observada; en su inclusión, la probabilidad total de todas esas tablas extremas es el valor p.
Aquí hay un ejemplo:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
La primera columna son valores , la segunda columna son las probabilidades y la tercera columna es el orden inducido.X1 , 1
Entonces, en el caso particular de la prueba exacta de Fisher, la probabilidad de cada tabla (equivalentemente, de cada valor ) puede considerarse el estadístico de prueba realX1 , 1 .
Si compara la estadística de prueba sugerida, induce el mismo orden en este caso (y creo que lo hace en general, pero no lo he verificado), ya que los valores más grandes de esa estadística son los valores más pequeños de la probabilidad, por lo que también podría considerarse 'la estadística' - pero también podrían hacerlo muchas otras cantidades; de hecho, cualquiera que conserve este orden de las s en todos los casos son estadísticas de prueba equivalentes, porque siempre producen valores p idénticos.El | X1 , 1- μ |X 1 , 1X1 , 1
También tenga en cuenta que con la noción más precisa de 'estadística de prueba' introducida al principio, ninguna de las estadísticas de prueba posibles para este problema tiene una distribución hipergeométrica; sí, pero en realidad no es una estadística de prueba adecuada para la prueba de dos colas (si hiciéramos una prueba unilateral en la que solo se considerara más asociación en la diagonal principal y no en la segunda diagonal como coherente con la prueba alternativa, entonces sería una estadística de prueba). Este es el mismo problema de una o dos colas con el que comencé.X1 , 1
[Editar: algunos programas presentan una estadística de prueba para la prueba de Fisher; Supongo que este sería un cálculo de tipo -2logL que sería asintóticamente comparable con un chi-cuadrado. Algunos también pueden presentar la odds ratio o su registro, pero eso no es del todo equivalente.]
mu | X 1 , 1 - μ | X 1 , 1El | X1 , 1- μ | no puede tener una distribución hipergeométrica en general porque no necesita ser un valor entero y luegoNo sería un número entero. Pero condicionalmente en los márgenes, tendrá una distribución hipergeométrica.μ El | X1 , 1- μ | X1,1
Si lo hace correctamente y fija los márgenes a valores conocidos, puede considerar (o cualquier otra celda) como su estadística. Con la analogía de sacar bolas de una urna que contiene bolas blancas y bolas negras sin reemplazo, puede interpretarse como el número de bolas blancas extraídas, donde es la suma de la primera fila, es la suma de la segunda fila, es la suma de la primera columna. k W B X 1 , 1 B W kX1,1 k W B X1,1 B W k
fuente
Realmente no tiene uno. Las estadísticas de prueba son una anomalía histórica: la única razón por la que tenemos una estadística de prueba es para obtener un valor p. La prueba exacta de Fisher salta más allá de una estadística de prueba y va directamente a un valor p.
fuente