Justificación de la prueba de hipótesis de una cola

35

Entiendo las pruebas de hipótesis de dos colas. Tienes (vs.H0:θ=θ0H1=¬H0:θθ0 ). El valor es la probabilidad de que θ genere datos al menos tan extremos como los observados.pθ

No entiendo las pruebas de hipótesis de una cola. Aquí, (vs. H 1 = ¬ H 0 : θ > θ 0 ). La definición del valor p no debería haber cambiado desde arriba: debería ser la probabilidad de que θ genere datos al menos tan extremos como los observados. Pero no sabemos θ , solo que está limitado por θ 0 .H0:θθ0H1=¬H0:θ>θ0θ θθ0

Así que en vez, veo que nos dicen los textos asumir que (no θ θ 0 según H 0 ) y calcular la probabilidad de que esto genera datos al menos tan extremo como lo que se observó, pero sólo en un extremo. Esto no parece tener nada que ver con las hipótesis, técnicamente.θ=θ0θθ0H0

Ahora, entiendo que esta es la prueba de hipótesis frequentist, y que no tiene antecedentes frequentists coloco en su s. Pero no debe sólo significa que las hipótesis son entonces imposible de aceptar o rechazar, en lugar de shoehorning el cálculo anterior en el cuadro?θ

Yang
fuente
Después se hizo una pregunta similar stats.stackexchange.com/questions/8196/…
robin girard
1
Su definición del valor es incompleta. Debe leerse (énfasis agregado): el valor p es la probabilidad de que θ genere datos al menos tan extremos como los observados, suponiendo que la hipótesis nula sea cierta . pagspagsθ
Alexis

Respuestas:

34

Esa es una pregunta reflexiva. Muchos textos (quizás por razones pedagógicas) se centran en este tema. Lo que realmente está pasando es que es un compuesto de "hipótesis" en su situación de un solo lado: en realidad es un conjunto de hipótesis, ni uno solo. Es necesario que para cada hipótesis posible en H 0H0 0 H0 0, la probabilidad de que la estadística de prueba caiga en la región crítica debe ser menor o igual que el tamaño de la prueba. Además, si la prueba es realmente alcanzar su tamaño nominal (que es algo bueno para lograr un alto poder), entonces el supremum de estas posibilidades (asumidas todas las hipótesis nulas) debería ser igual al tamaño nominal. En la práctica, para pruebas simples de ubicación de un parámetro que involucran ciertas familias de distribuciones "agradables", este supremum se alcanza para la hipótesis con el parámetro . Por lo tanto, como cuestión práctica, todos los cálculos se centran en esta distribución. Pero no debemos olvidarnos del resto del conjunto H 0θ0 0H0 0: esa es una distinción crucial entre las pruebas bilaterales y unilaterales (y entre las pruebas "simples" y "compuestas" en general).

Esto influye sutilmente en la interpretación de los resultados de las pruebas unilaterales. Cuando se rechaza el valor nulo, podemos decir que la evidencia apunta contra el verdadero estado de la naturaleza como cualquiera de las distribuciones en . Cuando no se rechaza el valor nulo, solo podemos decir que existe una distribución en H 0 que es "consistente" con los datos observados. Estamos no diciendo que todas las distribuciones en H 0 son consistentes con los datos: ni mucho menos! Muchos de ellos pueden producir probabilidades extremadamente bajas.H0 0H0 0H0 0

whuber
fuente
Todo lo que dijiste es válido e importante. Otro aspecto importante que creo es que, por lo general, la hipótesis nula se considera una hipótesis poco interesante. La alternativa se ve como la hipótesis científica. Es el que al experimentador le gustaría probar. Digo generalmente porque es diferente en las pruebas de equivalencia y no inferioridad. Ahora, con respecto al tema de las pruebas unilaterales, solo se dice el lado que tiene un parámetro mayor que el valor nulo que es interesante. Por lo tanto, todos los valores en el lado inferior se incorporan en el nulo.
Michael R. Chernick
stats.stackexchange.com/questions/333301/… Si tiene ganas de dar una respuesta a esta pregunta, o señalarme alguna bibliografía ...;)
Un anciano en el mar.
6

Veo el valor como la probabilidad máxima de un error tipo I. Si θ θ 0 , la probabilidad de una tasa de error tipo I puede ser efectivamente cero, pero así será. Cuando se mira la prueba desde una perspectiva mínima, un adversario nunca sacaría de lo más profundo del "interior" de la hipótesis nula de todos modos, y el poder no debería verse afectado. Para situaciones simples (la prueba t , por ejemplo) es posible construir una prueba con una tasa de tipo I máxima garantizada, permitiendo tales hipótesis nulas unilaterales.pagsθθ0 0t

shabbychef
fuente
2

Usaría una prueba de hipótesis unilateral si solo los resultados en una dirección respaldan la conclusión que está tratando de llegar.

Piense en esto en términos de la pregunta que hace. Supongamos, por ejemplo, que desea ver si la obesidad aumenta el riesgo de ataque cardíaco. Recopila sus datos, que pueden consistir en 10 personas obesas y 10 personas no obesas. Ahora, digamos que, debido a factores de confusión no registrados, diseño experimental deficiente o simplemente mala suerte, observa que solo 2 de las 10 personas obesas tienen ataques cardíacos, en comparación con 8 de las personas no obesas.

Ahora, si realizara una prueba de hipótesis de dos lados con estos datos, concluiría que hubo una asociación estadísticamente significativa (p ~ 0.02) entre la obesidad y el riesgo de ataque cardíaco. Sin embargo, la asociación estaría en la dirección opuesta a la que realmente esperaba ver, por lo tanto, el resultado de la prueba sería engañoso.

(En la vida real, un experimento que produjo un resultado tan contraintuitivo podría llevar a otras preguntas que son interesantes en sí mismas: por ejemplo, el proceso de recopilación de datos podría necesitar una mejora, o podría haber factores de riesgo previamente desconocidos en el trabajo, o tal vez la sabiduría convencional simplemente está equivocada. Pero estos problemas no están realmente relacionados con la pregunta estrecha de qué tipo de prueba de hipótesis utilizar).

Hong Ooi
fuente
2

los pags-valor es la probabilidad del evento respectivo bajo la condición de queH0 0es cierto . El ejemplo de juguete más simple posible son dos lanzamientos de monedas. Los 2 ladosH0 0sería que consideras que la moneda es justa, es decir, arrojas una cabeza y una cola. La probabilidad de eso es0,5. H1en este caso es que lo consideras sesgado hacia un lado o hacia el otro, es decir, arrojas dos cabezas o dos colas. La probabilidad nuevamente es0,5

Para una de 1 cara H0 0piensa en un juego en el que pones tu dinero en cara. Estás de acuerdo con que la moneda sea justa pero, por supuesto, también te sientas cómoda con el sesgo hacia las caras. Esta es tuH0 0 donde tienes las posibilidades de una cabeza y una cola o dos cabezas: 0,75 probabilidad. H1 es solo el caso restante de dos colas donde llamarías falta: 0.25probabilidad. Tenga en cuenta que debido a que considera que toda la región, desde regular hasta sesgada hacia las cabezas, es su colas por defecto, debe considerarse mucho más improbable y aún más sugestivo de que algo no está en orden.

Ahora cuando los eventos de nuestro H1Sin embargo, sus probabilidades son los valores p bajo la condición de que los respectivosH0 0son ciertas , como se señaló anteriormente. Entonces, dependiendo de su nivel de confianza, puede o no puede rechazar suH0 0's.

Puede experimentar con este ejemplo de juguete en R usted mismo, también debe probar diferentes números absolutos y combinaciones de cabezas y colas:

> binom.test(2,2,alternative="two.sided")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.5
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.1581139 1.0000000
sample estimates:
probability of success 
                     1

> binom.test(2,2,alternative="greater")

    Exact binomial test

data:  2 and 2
number of successes = 2, number of trials = 2, p-value = 0.25
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
 0.2236068 1.0000000
sample estimates:
probability of success 
                     1 
vonjd
fuente