Cuando la "hipótesis nula" incluye más de un estado de la naturaleza, la tasa de falsos positivos (FPR) real puede variar con ese estado. Todo lo que podemos hacer es garantizar un límite en el FPR sin importar cuál sea ese estado de la naturaleza, pero no siempre podemos garantizar que el FPR sea igual a α .
(Hay otras razones por las cuales el FPR podría no igualar su valor objetivo , como cuando el estadístico de prueba es discreto. Estas situaciones generalmente se pueden curar mediante procedimientos de decisión aleatorios. Como tal, no proporcionan ninguna información fundamental sobre el pregunta.)α
Considere la prueba clásica de una cola donde se supone que el estadístico tiene una distribución Normal de media desconocida y (por simplicidad) desviación estándar conocida . se compara con . La hipótesis nula es mientras que la hipótesis alternativa es . La región de rechazo por lo tanto es de la formaXμσμ0H0:μ≥0HA:μ<0
R(α)=(−∞,Zα]
donde se elige para que la probabilidad de observar una estadística en esta región sea como máximo :Zα α
α=sup(Pr(X∈R(α))).(1)
Bajo los supuestos, esta probabilidad viene dada por la función de distribución Normal :Φ
Pr(X∈R(α))=Φ(Zα−μσ).(2)
Esta probabilidad depende del valor desconocido de . μ Por lo tanto, no podemos garantizar que realmente sea igual a . De hecho, para grande , es prácticamente cero. Sin embargo, tenemos que cubrir todas nuestras bases y garantizar que mientras sea consistente con la hipótesis nula, la tasa de falsos positivos no excederá . αμ(2)μ(1)α
Es un problema furtivo. Si tiene datos continuos y los trata adecuadamente, entonces . Sin embargo, cuando sus datos son discretos, puede que no sea posible para . Considere los datos binomiales sobre si una moneda es justa, con 5 lanzamientos de monedas, los posibles valores p unilaterales son:Pr(p≤α|H0)=α p=α
Solo cabezas podrían producir un error de tipo I, y la probabilidad asociada con eso es . De manera que la tasa de error de tipo I sería llevará a cabo a "como máximo ", pero no igual a .0 ≈0.03 α α
Por otro lado, hay estrategias de análisis (no válidas) que conducen a tasas de error de tipo I que son mayores que , incluso cuando (por ejemplo, rutinas de selección por pasos).α p<α
Tengo una discusión más completa aquí: comparación y contraste, valores p, niveles de significancia y error tipo I
fuente