Mientras estudiaba para mi curso de estadísticas, estaba tratando de entender la diferencia entre las pruebas de hipótesis de una y dos colas. Específicamente, ¿por qué la prueba de una cola rechaza la nula mientras que la de dos colas no?
Un ejemplo:
hypothesis-testing
Lu Ci
fuente
fuente
Respuestas:
Una prueba de dos colas prueba la diferencia en cualquier dirección. Por lo tanto, el valor P sería el área debajo de la distribución t a la derecha de t = 1.92 MÁS el área debajo de la distribución a la izquierda de t = -1.92. Eso es el doble de área que la prueba de una cola y, por lo tanto, el valor P es dos veces mayor.
Si usa una prueba de una cola, obtiene potencia, pero al costo potencial de tener que ignorar una diferencia que está en la dirección opuesta a la hipotetizada antes de obtener los datos. Si obtuvo los datos antes de formalizar y registrar la hipótesis, realmente debería usar una prueba de dos colas. Del mismo modo, si le interesa un efecto en cualquier dirección, utilice una prueba de dos colas. De hecho, es posible que desee utilizar una prueba de dos colas como enfoque predeterminado y solo usar una prueba de una cola en el caso inusual en el que un efecto solo puede existir en una dirección.
fuente
El área debajo de la curva no es el doble de grande para una prueba de dos colas: para una prueba de dos colas con p = .05 crítico, está probando con qué frecuencia los datos observados podrían extraerse del 2.5% inferior o superior de una distribución nula ( .05 en total). Con una prueba de 1 cola, está probando con qué frecuencia los datos provendrían de la cola extrema del 5% de una cola (preespecificada).
En parte, la respuesta a su pregunta es práctica: la mayoría de los investigadores ven los experimentos que informan que las pruebas de 1 cola son poco probables de replicar (es decir, suponen que el investigador eligió esto para que sus estadísticas sean "significativas").
Sin embargo, hay casos de uso válidos. Si sabe que cualquier resultado en la dirección inversa es imposible según la teoría que se está probando, entonces, como lo señaló un comentario anterior, puede especificar esto con anticipación y realizar una prueba de 1 cola. La mayoría de la gente, de nuevo, todavía vería esto circunspectivamente.
fuente
Esto lleva a la pregunta: ¿por qué usar diferentes estadísticas de prueba? La razón es que las alternativas son diferentes y, por lo tanto, el poder de cada estadística de prueba es diferente. Específicamente, el poder de cada prueba se reduce (siempre que usemos la misma importancia) si usamos el estadístico de prueba y la región de rechazo de la otra prueba.
fuente