¿Diferencia entre pruebas de una y dos colas?

Mientras estudiaba para mi curso de estadísticas, estaba tratando de entender la diferencia entre las pruebas de hipótesis de una y dos colas. Específicamente, ¿por qué la prueba de una cola rechaza la nula mientras que la de dos colas no?

Un ejemplo:

La diferencia entre las pruebas de hipótesis de una y dos colas

hypothesis-testing Lu Ci
fuente

Tenga en cuenta que solo está rechazando a un nivel de significancia específico. Todavía puede rechazar ambas hipótesis elevando el nivel de significancia al 10%. también fallaría en rechazar ambos si bajara el nivel de significancia al 1%.

chanceislogic

Respuestas:

Una prueba de dos colas prueba la diferencia en cualquier dirección. Por lo tanto, el valor P sería el área debajo de la distribución t a la derecha de t = 1.92 MÁS el área debajo de la distribución a la izquierda de t = -1.92. Eso es el doble de área que la prueba de una cola y, por lo tanto, el valor P es dos veces mayor.

Si usa una prueba de una cola, obtiene potencia, pero al costo potencial de tener que ignorar una diferencia que está en la dirección opuesta a la hipotetizada antes de obtener los datos. Si obtuvo los datos antes de formalizar y registrar la hipótesis, realmente debería usar una prueba de dos colas. Del mismo modo, si le interesa un efecto en cualquier dirección, utilice una prueba de dos colas. De hecho, es posible que desee utilizar una prueba de dos colas como enfoque predeterminado y solo usar una prueba de una cola en el caso inusual en el que un efecto solo puede existir en una dirección.

Michael Lew
fuente

Gracias por tu comentario, Michael. Esto es lo que no entiendo: ¿cómo puede el área bajo la curva ser el doble de grande para la prueba de dos colas? ¿No debería ser P igual en ambos casos, ya que alfa = 0.05?

Lu Ci

alpha, en su pregunta, es solo su límite para tomar una decisión sobre lo que significa p (rechazar nulo o no). Por lo tanto, no influye en el valor de p.

John

Un poco quisquilloso, pero la noción de que necesita elegir la hipótesis antes de ver los datos no es necesaria. Puedes hacer dos pruebas unilaterales. Siempre rechazará la dirección no favorecida por los datos. Por lo tanto, tiene sentido ir con la prueba unilateral que es favorecida por los datos.

probabilidadislogica

@probabilityislogic -Estoy completamente de acuerdo, excepto cuando uno quiere que el valor alfa refleje la tasa de error falso positivo a largo plazo real (es decir, uno quiere usar el enfoque de Neyman-Pearson). Si utiliza una prueba unilateral y decide la dirección del cambio para evaluar en función del efecto observado, obtendrá exactamente el doble de resultados falsos positivos que su nivel alfa implicaría.

Michael Lew

Es solo la tasa de error a largo plazo para alguien que sigue ignorando los datos anteriores. Esta no es una buena manera de lograr un buen rendimiento a largo plazo. La tasa de error dada por la significación está sobre todos los conjuntos de datos que podríamos haber observado una vez .

probabilidadislogica

El área debajo de la curva no es el doble de grande para una prueba de dos colas: para una prueba de dos colas con p = .05 crítico, está probando con qué frecuencia los datos observados podrían extraerse del 2.5% inferior o superior de una distribución nula ( .05 en total). Con una prueba de 1 cola, está probando con qué frecuencia los datos provendrían de la cola extrema del 5% de una cola (preespecificada).

En parte, la respuesta a su pregunta es práctica: la mayoría de los investigadores ven los experimentos que informan que las pruebas de 1 cola son poco probables de replicar (es decir, suponen que el investigador eligió esto para que sus estadísticas sean "significativas").

Sin embargo, hay casos de uso válidos. Si sabe que cualquier resultado en la dirección inversa es imposible según la teoría que se está probando, entonces, como lo señaló un comentario anterior, puede especificar esto con anticipación y realizar una prueba de 1 cola. La mayoría de la gente, de nuevo, todavía vería esto circunspectivamente.

tim
fuente

$S(D)$ $RR$

$S(D)=|t|$ $|t|>t_{0}$ $t_{0}$ $\alpha$ $S(D)=t$ $t>t_{1}$ $t_{1}$ $Pr(|t|>t_{0}|H_{0})\geq Pr(t>t_{0}|H_{0})$ $t_{0}\geq t_{1}$

Esto lleva a la pregunta: ¿por qué usar diferentes estadísticas de prueba? La razón es que las alternativas son diferentes y, por lo tanto, el poder de cada estadística de prueba es diferente. Específicamente, el poder de cada prueba se reduce (siempre que usemos la misma importancia) si usamos el estadístico de prueba y la región de rechazo de la otra prueba.

probabilidadislogica
fuente