Cuando hacemos pruebas terminamos con dos resultados.
1) Rechazamos la hipótesis nula
2) No podemos rechazar la hipótesis nula.
No hablamos de aceptar hipótesis alternativas. Si no hablamos de aceptar hipótesis alternativas, ¿por qué necesitamos tener hipótesis alternativas?
Aquí está la actualización: ¿Podría alguien darme dos ejemplos:
1) rechazar hipótesis nula es igual a aceptar hipótesis alternativa
2) rechazar hipótesis nula no es igual a aceptar hipótesis alternativa
hypothesis-testing
usuario1700890
fuente
fuente
Respuestas:
Me centraré en "Si no hablamos de aceptar hipótesis alternativas, ¿por qué necesitamos tener hipótesis alternativas?"
Porque nos ayuda a elegir una estadística de prueba significativa y diseñar nuestro estudio para que tenga un alto poder --- una alta probabilidad de rechazar el nulo cuando la alternativa es verdadera. Sin una alternativa, no tenemos un concepto de poder.
Imagine que solo tenemos una hipótesis nula y no hay alternativa. Entonces no hay orientación sobre cómo elegir una estadística de prueba que tendrá un alto poder. Todo lo que podemos decir es: "Rechace el valor nulo siempre que observe una estadística de prueba cuyo valor es poco probable bajo el valor nulo". Podemos elegir algo arbitrario: podríamos dibujar números aleatorios uniformes (0,1) y rechazar los valores nulos cuando están por debajo de 0,05. Esto sucede bajo el nulo "raramente", no más del 5% del tiempo --- sin embargo, también es tan raro cuando el nulo es falso. Entonces, esto es técnicamente una prueba estadística, pero no tiene sentido como evidencia a favor o en contra de nada.
En cambio, generalmente tenemos algunas hipótesis alternativas científicamente plausibles ("En mi experimento hay una diferencia positiva en los resultados entre los grupos de tratamiento y control"). Nos gustaría defenderlo contra posibles críticos que plantearían la hipótesis nula como defensores del diablo ("No estoy convencido todavía --- tal vez su tratamiento realmente duele o no tenga ningún efecto , y cualquier diferencia aparente en el los datos se deben solo a la variación del muestreo ").
Con estas 2 hipótesis en mente, ahora podemos configurar una prueba poderosa , eligiendo una estadística de prueba cuyos valores típicos bajo la alternativa son poco probables bajo nulo. (Un estadístico t positivo de 2 muestras lejos de 0 no sería sorprendente si la alternativa es verdadera, pero sorprendente si el nulo es verdadero.) Luego calculamos la distribución de muestreo del estadístico de prueba bajo el nulo, para que podamos calcular los valores p --- e interpretarlos. Cuando observamos un estadístico de prueba que es poco probable bajo nulo, especialmente si el diseño del estudio, el tamaño de la muestra, etc. fueron elegidos para tener un alto poder , esto proporciona alguna evidencia para la alternativa.
Entonces, ¿por qué no hablamos de "aceptar" la hipótesis alternativa? Porque incluso un estudio de gran potencia no proporciona una prueba completamente rigurosa de que el nulo está mal. Sigue siendo un tipo de evidencia, pero más débil que otros tipos de evidencia.
fuente
Históricamente, hubo desacuerdo sobre si era necesaria una hipótesis alternativa. Permítanme explicar este punto de desacuerdo considerando las opiniones de Fisher y Neyman, dentro del contexto de las estadísticas frecuentistas, y una respuesta bayesiana.
Fisher - No necesitamos una hipótesis alternativa; simplemente podemos probar una hipótesis nula utilizando una prueba de bondad de ajuste. El resultado es un valor , que proporciona una medida de evidencia para la hipótesis nula.p
Neyman : debemos realizar una prueba de hipótesis entre un valor nulo y una alternativa. La prueba es tal que daría lugar a errores de tipo 1 a una velocidad fija y predeterminada, . El resultado es una decisión: rechazar o no rechazar la hipótesis nula en el nivel .α α
Necesitamos una alternativa desde una perspectiva teórica de decisión: estamos haciendo una elección entre dos cursos de acción, y porque debemos informar el poder de la prueba Deberíamos buscar las pruebas más potentes posibles para tener la mejor oportunidad de rechazar cuando la alternativa es verdadera.1−p(Accept H0|H1) H0
Para satisfacer estos dos puntos, la hipótesis alternativa no puede ser la vaga 'no '.H0
Bayesiano : debemos considerar al menos dos modelos y actualizar su plausibilidad relativa con datos. Con solo un modelo, tenemos sin importar qué datos recolectemos. Para hacer cálculos en este marco, la hipótesis alternativa (o modelo como se conocería en este contexto) no puede ser la mal definida 'no '. Lo llamo mal definido ya que no podemos escribir el modelo .p(H0)=1 H0 p(data|not H0)
fuente
No estoy 100% seguro de si este es un requisito formal, pero generalmente la hipótesis nula y la hipótesis alternativa son: 1) complementarias y 2) exhaustivas. Es decir: 1) no pueden ser ambas verdaderas al mismo tiempo; 2) si uno no es verdadero, el otro debe ser verdadero.
Considere la prueba simple de alturas entre niñas y niños. Una hipótesis nula típica en este caso es que . Una hipótesis alternativa sería . Entonces, si nulo no es verdadero, la alternativa debe ser verdadera.heightboys=heightgirls heightboys≠heightgirls
fuente
En una prueba de hipótesis clásica, el único papel matemático desempeñado por la hipótesis alternativa es que afecta el orden de la evidencia a través de la estadística de prueba elegida. La hipótesis alternativa se utiliza para determinar el estadístico de prueba apropiado para la prueba, que es equivalente a establecer una clasificación ordinal de todos los resultados de datos posibles de los más propicios para la hipótesis nula (en contra de la alternativa establecida) a los menos propicios para las hipótesis nulas (en contra de la alternativa indicada). Una vez que haya formado esta clasificación ordinal de los posibles resultados de datos, la hipótesis alternativa ya no juega un papel matemático adicional en la prueba .
Explicación formal: en cualquier prueba de hipótesis clásica conn x=(x1,...,xn) T:Rn→R que mapea cada resultado posible de los datos en una escala ordinal que mide si es más propicio para la hipótesis nula o alternativa. (Sin pérdida de generalidad, asumiremos que los valores más bajos son más propicios para la hipótesis nula y los valores más altos son más propicios para la hipótesis alternativa. A veces decimos que los valores más altos del estadístico de prueba son "más extremos" en la medida en que constituyen más extremos evidencia de la hipótesis alternativa.) El valor p de la prueba viene dado por:
Esta función de valor p determina completamente la evidencia en la prueba para cualquier vector de datos. Cuando se combina con un nivel de significancia elegido, determina el resultado de la prueba para cualquier vector de datos. (Hemos descrito esto para un número fijo de puntos de datos pero esto puede extenderse fácilmente para permitir arbitraria ). Es importante tener en cuenta que el valor p se ve afectado por el estadístico de prueba solo a través de la escala ordinal que inducen n , por lo tanto, si aplica una transformación monotónicamente creciente a las estadísticas de la prueba, esto no hace ninguna diferencia con la prueba de hipótesis (es decir, es la misma prueba). Esta propiedad matemática simplemente refleja el hecho de que el único propósito del estadístico de prueba es inducir una escala ordinal en el espacio de todos los posibles vectores de datos, para mostrar cuáles son más propicios para la nula / alternativa.
La hipótesis alternativa afecta esta medición solo a través de la funciónT , que se elige en base a las hipótesis nulas y alternativas establecidas dentro del modelo general. Por lo tanto, podemos considerar la función estadística de prueba como una función del modelo general y las dos hipótesis. Por ejemplo, para una prueba de razón de verosimilitud, el estadístico de prueba se forma tomando una razón (o logaritmo de una razón) de supremums de la función de verosimilitud sobre rangos de parámetros relacionados con las hipótesis nula y alternativa.T≡g(M,H0,HA) M
¿Qué significa esto si comparamos pruebas con diferentes alternativas? Suponga que tiene un modelo fijo y desea hacer dos pruebas de hipótesis diferentes comparando la misma hipótesis nula con dos alternativas diferentes y . En este caso, tendrá dos funciones estadísticas de prueba diferentes:M H0 HA H′A
que conduce a las funciones de valor p correspondientes:
Es importante tener en cuenta que si y son monotónicas transformaciones crecientes de uno otro, entonces las funciones p-valor y son idénticos, por lo que ambas pruebas son la misma prueba. Si las funciones y no son transformaciones monotónicas crecientes entre sí, entonces tenemos dos pruebas de hipótesis genuinamente diferentes.T T′ p p′ T T′
fuente
La razón por la que no pensaría en aceptar la hipótesis alternativa es porque eso no es lo que estamos probando. La prueba de significación de hipótesis nulas (NHST) calcula la probabilidad de observar datos tan extremos como los observados (o más) dado que la hipótesis nula es verdadera, o en otras palabras, NHST calcula un valor de probabilidad que está condicionado al hecho de que la hipótesis nula es verdadera , . Por lo tanto, es la probabilidad de que los datos supongan que la hipótesis nula es verdadera. Nunca usa o da la probabilidad de una hipótesis (ni nula ni alternativa). Por lo tanto, cuando observa un valor p pequeño, todo lo que sabe es que los datos que observó parecen poco probables enP(data|H0) H0 , por lo que está recopilando pruebas contra el nulo y a favor de cualquiera que sea su explicación alternativa.
Antes de ejecutar el experimento, puede decidir un nivel de corte ( ) que considere que resulta significativo, lo que significa que si su valor p cae por debajo de ese nivel, concluye que la evidencia contra el nulo es tan abrumadoramente alta que los datos deben haberse originado de algún otro proceso de generación de datos y usted rechaza la hipótesis nula basada en esa evidencia. Si el valor p está por encima de ese nivel, no puede rechazar la hipótesis nula, ya que su evidencia no es lo suficientemente sustancial como para creer que su muestra proviene de un proceso de generación de datos diferente.α
La razón por la que formula una hipótesis alternativa es porque probablemente tenía un experimento en mente antes de comenzar a tomar muestras. La formulación de una hipótesis alternativa también puede decidir si usa una prueba de una o dos colas y, por lo tanto, le da más poder estadístico (en el escenario de una cola). Pero técnicamente para ejecutar la prueba no necesita formular una hipótesis alternativa, solo necesita datos.
fuente