¿Cuál es una buena regla general para elegir la pregunta para la hipótesis nula? Por ejemplo, si quiero verificar si la hipótesis B es verdadera, ¿debo usar B como nulo, B como hipótesis alternativa o NO B como nulo? Espero que la pregunta sea clara. Sé que tiene algo que ver con el error que quiero minimizar (¿Tipo I?), Pero sigo olvidando cómo funciona, porque no tengo una intuición clara para ello. Gracias.
hypothesis-testing
Néstor
fuente
fuente
Respuestas:
Una regla general de un buen asesor mío era establecer la hipótesis nula para el resultado que no desea que sea cierto, es decir, el resultado cuyo opuesto directo desea mostrar.
Ejemplo básico: suponga que ha desarrollado un nuevo tratamiento médico y desea demostrar que, de hecho, es mejor que el placebo. Entonces, establece la hipótesis nula nuevo tratamiento es igual o peor que el placebo y la hipótesis alternativa H 1 : = el nuevo tratamiento es mejor que el placebo.H0:= H1:=
Esto se debe a que en el curso de una prueba estadística rechazas la hipótesis nula (y favoreces la hipótesis alternativa) o no puedes rechazarla. Dado que su "objetivo" es rechazar la hipótesis nula, la establece en el resultado que no desea que sea cierto.
Nota al margen: Soy consciente de que no se debe configurar una prueba estadística para torcerla y romperla hasta que se rechace la hipótesis nula, el lenguaje informal solo se usó para hacer que esta regla sea más fácil de recordar.
Esto también puede ser útil: ¿Cuál es el significado de los valores p y los valores t en las pruebas estadísticas? y / o ¿Cuál es una buena introducción a las pruebas de hipótesis estadísticas para informáticos?
fuente
Si la hipótesis B es la hipótesis interesante, puede tomar no-B como la hipótesis nula y controlar, bajo la nula, la probabilidad del error de tipo I por rechazar erróneamente no-B en el nivel . Rechazar no-B se interpreta como evidencia a favor de B porque controlamos el error tipo I, por lo tanto, es poco probable que no-B sea cierto. Confundido ...?α
Tomemos el ejemplo de tratamiento versus ningún tratamiento en dos grupos de una población. La hipótesis interesante es que el tratamiento tiene un efecto, es decir, hay una diferencia entre el grupo tratado y el grupo no tratado debido al tratamiento. La hipótesis nula es que no hay diferencia, y controlamos la probabilidad de rechazar erróneamente esta hipótesis. Por lo tanto, controlamos la probabilidad de concluir erróneamente que hay un efecto de tratamiento cuando no hay efecto de tratamiento. El error tipo II es la probabilidad de aceptar erróneamente el valor nulo cuando hay un efecto de tratamiento.
La formulación anterior se basa en el marco de Neyman-Pearson para pruebas estadísticas, donde las pruebas estadísticas se consideran un problema de decisión entre casos, lo nulo y lo alternativo. El nivel es la fracción de veces que cometemos un error tipo I si (independientemente) repetimos la prueba. En este marco, realmente no hay ninguna distinción formal entre lo nulo y lo alternativo. Si intercambiamos el nulo y la alternativa, intercambiamos la probabilidad de errores de tipo I y tipo II. Sin embargo, no controlamos la probabilidad de error de tipo II anterior (depende de cuán grande sea el efecto del tratamiento), y debido a esta asimetría, podemos preferir decir que no rechazamosα la hipótesis nula (en lugar de eso aceptamos la hipótesis nula). Por lo tanto, debemos tener cuidado al concluir que la hipótesis nula es verdadera solo porque no podemos rechazarla.
En un marco de prueba de significancia de Fisher realmente solo hay una hipótesis nula y se calcula, bajo el nulo, un valor para los datos observados. Los valores p más pequeños se interpretan como evidencia más fuerte contra el nulo. Aquí la hipótesis nula definitivamente no es B (sin efecto del tratamiento) y el valor p se interpreta como la cantidad de evidencia contra el nulo. Con un valor p pequeño , podemos rechazar con confianza el valor nulo, que no hay efecto del tratamiento, y concluir que existe un efecto del tratamiento. En este marco solo podemos rechazar o no rechazar (nunca aceptar) el nulo, y se trata de falsificar el nulo. Tenga en cuenta que la ppag pag pag pag pag -valor no necesita ser justificado por un número repetido (imaginario) de decisiones.
Ninguno de los marcos está exento de problemas, y la terminología a menudo es confusa. Puedo recomendar el libro Evidencia estadística: un paradigma de probabilidad de Richard M. Royall para un tratamiento claro de los diferentes conceptos.
fuente
La respuesta "frecuente" es inventar una hipótesis nula de la forma "no B" y luego argumentar en contra de "no B", como en la respuesta de Steffen. Este es el equivalente lógico de hacer el argumento "Estás equivocado, por lo tanto, debo tener razón". Este es el tipo de razonamiento que utiliza el político (es decir, la otra parte es mala, por lo tanto, nosotros somos buenos). Es bastante difícil tratar con más de 1 alternativa bajo este tipo de razonamiento. Esto se debe a que el argumento "estás equivocado, por lo tanto estoy en lo correcto" solo tiene sentido cuando no es posible que ambos estén equivocados, lo que ciertamente puede suceder cuando hay más de una hipótesis alternativa.
La respuesta "bayesiana" es simplemente calcular la probabilidad de la hipótesis que le interesa probar, condicional a cualquier evidencia que tenga. Siempre contiene información previa, que son simplemente las suposiciones que ha hecho para plantear bien su problema (todos los procedimientos estadísticos se basan en información previa, los bayesianos simplemente los hacen más explícitos). Por lo general, también consta de algunos datos, y tenemos el teorema de Bayes
fuente
La hipótesis nula generalmente debe suponer que las diferencias en una variable de respuesta se deben solo al error.
A
x
A
x
No rechazar esta hipótesis nula se interpretaría como:
1) cualquier diferencia
x
se debe a un error solo y noA
o,2) que los datos son inadecuados para detectar una diferencia aunque exista una (vea el error Tipo 2 a continuación).
A
x
A
x
A
x
fuente