En el famoso experimento de Fisher la observable es el número de corregido taza adivinado que tiene dos tipos de taza A y B . Por lo general, es interesante calcular la región crítica para rechazar la hipótesis nula (la mujer adivina al azar) dado el tamaño de la prueba α . Esto se hace fácilmente usando la distribución hipergeométrica. De la misma manera puedo calcular el tamaño de la prueba dada la región crítica.
Una pregunta diferente es: ¿cómo calcular el poder de la prueba, dada una hipótesis alternativa? Supongamos, por ejemplo, que la mujer es capaz de adivinar correctamente con probabilidad en la taza individual ( P ( adivinar A | verdadero A ) = P ( adivinar B | verdadero B ) = 0.9 ). ¿Cuál es el poder de la prueba, suponiendo un número total de tazas igual a N = 8 y un número total de tazas de un tipo n = N / 2 = 4? (Desafortunadamente) la dama sabe .
Dicho en otras palabras: ¿cuál es la distribución de (número de tazas correctas bajo la hipótesis alternativa) si la dama sabe que hay n tazas de un tipo?
fuente
Respuestas:
Bajo la alternativa, la dama no está adivinando al azar, pero "no adivina al azar" cubre una infinidad de situaciones diferentes. Es posible que siempre adivine perfectamente o que lo haga solo un poco mejor que las suposiciones aleatorias ... y, en el caso general, ni siquiera hay una "escala" de variable única que no sea aleatoria para trabajar (por lo que ni siquiera tenemos un poder curva a menos que restrinjamos los tipos de respuestas no aleatorias que podría dar).
Entonces, para calcular una potencia, debemos ser muy específicos acerca de cómo no es aleatorio (y qué tan no aleatorio es de esa manera particular).
Podríamos suponer, por ejemplo, que tiene una sensación de cuánto sabe cada taza a la leche que se agregó primero: un índice de "primicia de la leche" que es una variable aleatoria en que tiene un valor diferente ( mayor) significa cuando la leche se agrega primero, por ejemplo, podríamos suponer que es normal o logoístico, con media μ 0 y varianza σ 2 = 1 / ω 2 ( ω 2 se conoce como "precisión") cuando la leche se agrega por última vez y media μ 1 y varianza σ 2( - ∞ , ∞ ) μ0 0 σ2= 1 / ω2 ω2 μ1 σ2 cuando se agrega leche primero (de hecho, una presunción más simple pero más restrictiva podría ser establecer, por ejemplo, para que ahora todo sea función de una variable, la precisión). Entonces, para cualquier valor dado de esos parámetros, podríamos calcular la probabilidad de que ella obtenga las 8 tazas correctas (que los cuatro valores más pequeños de "primicia de la leche" que experimenta estén asociados con las cuatro tazas de la segunda leche); Si el cálculo exacto fuera demasiado difícil para nosotros, podríamos simularlo con la precisión deseada. [En el caso de que se presuma que la no aleatoriedad es función de una sola variable, tendríamos una curva de potencia, un valor de potencia para cada valor del parámetro].μ1= - μ0 0= 1
Ese es un tipo específico de modelo de cómo podría funcionar "mejor que al azar" con el que podríamos especificar parámetros y obtener un valor de potencia.
Por supuesto, podríamos suponer muchas otras formas de no aleatoriedad que esta.
fuente
La distribución del número correcto de conjeturas bajo la hipótesis alternativa sigue una distribución hipergeométrica no central , que se parametriza en términos de la razón de probabilidades, es decir, cuánto más altas son las probabilidades de que la mujer adivine "té primero" cuando está en De hecho, el té realmente se agregó primero en lugar de cuando en realidad se agregó primero la leche (o al revés). Si la razón de posibilidades es 1, obtenemos la distribución hipergeométrica central.
Vamos a ver si esto funciona. Usaré R con fines ilustrativos, usando el
MCMCpack
paquete, que tiene la funcióndnoncenhypergeom()
de calcular la densidad de una distribución hipergeométrica (no central). Tiene argumentosx
para el número correcto de conjeturas (cuidado: este es el número correcto de conjeturas debajo de una de las dos condiciones, por ejemplo, cuando el té se sumó primero), argumentosn1
,n2
ym1
para tres de los cuatro márgenes, ypsi
para La verdadera razón de posibilidades. Calculemos la densidadx
igual a 0 a 4 (con todos los márgenes iguales a 4) cuando la razón de probabilidad real es 1:Esto produce:
Por lo tanto, existe una probabilidad del 1,43% de que la mujer haga 8 conjeturas correctas (es decir, adivine las 4 tazas correctamente donde se agregó el té primero y, por lo tanto, también adivina correctamente las 4 tazas donde se agregó la leche primero) bajo la hipótesis nula. De hecho, esta es la cantidad de evidencia que Fisher consideró suficiente para rechazar la hipótesis nula.
Esto produce:
Entonces, el poder es aproximadamente del 83%.
fuente