¿Por qué necesitamos hipótesis alternativas?

14

Cuando hacemos pruebas terminamos con dos resultados.

1) Rechazamos la hipótesis nula

2) No podemos rechazar la hipótesis nula.

No hablamos de aceptar hipótesis alternativas. Si no hablamos de aceptar hipótesis alternativas, ¿por qué necesitamos tener hipótesis alternativas?

Aquí está la actualización: ¿Podría alguien darme dos ejemplos:

1) rechazar hipótesis nula es igual a aceptar hipótesis alternativa

2) rechazar hipótesis nula no es igual a aceptar hipótesis alternativa

usuario1700890
fuente
1
Porque estás tratando de sacar algunas conclusiones. Si no es la hipótesis nula, entonces tal vez sea la hipótesis alternativa (aunque no esté completamente seguro de que la hipótesis alternativa sea válida, si rechaza la hipótesis nula). Cuando rechaza la hipótesis nula, dice que tiene alguna "evidencia" para concluir que la hipótesis alternativa puede ser cierta.
nbro
@nbro, gracias, agregué una pregunta a mi publicación original. ¿Podrías echar un vistazo?
user1700890
1
No estoy muy familiarizado con las pruebas de hipótesis, en general. Es mejor que espere a que una persona más competente responda sus preguntas.
nbro
Si su hipótesis alternativa es un complemento de la hipótesis nula, no tiene sentido utilizarla en absoluto. Nadie utiliza hipótesis alternativas en la práctica por este motivo fuera de los libros de texto.
Aksakal
"No hablamos de aceptar hipótesis alternativas" - no es cierto para todos los posibles "nosotros". Algunas personas hablan sobre aceptar la hipótesis alternativa, y muchas otras lo piensan , incluso si respetan el tabú en contra de decirlo . Es algo pedante evitar hablar de aceptar la hipótesis alternativa cuando no hay duda razonable de que es cierta. Pero, dado que las estadísticas son tan propensas al mal uso, en este caso la pedantería es probablemente algo bueno en la medida en que inculca precaución en la interpretación de los resultados.
John Coleman

Respuestas:

8

Me centraré en "Si no hablamos de aceptar hipótesis alternativas, ¿por qué necesitamos tener hipótesis alternativas?"

Porque nos ayuda a elegir una estadística de prueba significativa y diseñar nuestro estudio para que tenga un alto poder --- una alta probabilidad de rechazar el nulo cuando la alternativa es verdadera. Sin una alternativa, no tenemos un concepto de poder.

Imagine que solo tenemos una hipótesis nula y no hay alternativa. Entonces no hay orientación sobre cómo elegir una estadística de prueba que tendrá un alto poder. Todo lo que podemos decir es: "Rechace el valor nulo siempre que observe una estadística de prueba cuyo valor es poco probable bajo el valor nulo". Podemos elegir algo arbitrario: podríamos dibujar números aleatorios uniformes (0,1) y rechazar los valores nulos cuando están por debajo de 0,05. Esto sucede bajo el nulo "raramente", no más del 5% del tiempo --- sin embargo, también es tan raro cuando el nulo es falso. Entonces, esto es técnicamente una prueba estadística, pero no tiene sentido como evidencia a favor o en contra de nada.

En cambio, generalmente tenemos algunas hipótesis alternativas científicamente plausibles ("En mi experimento hay una diferencia positiva en los resultados entre los grupos de tratamiento y control"). Nos gustaría defenderlo contra posibles críticos que plantearían la hipótesis nula como defensores del diablo ("No estoy convencido todavía --- tal vez su tratamiento realmente duele o no tenga ningún efecto , y cualquier diferencia aparente en el los datos se deben solo a la variación del muestreo ").

Con estas 2 hipótesis en mente, ahora podemos configurar una prueba poderosa , eligiendo una estadística de prueba cuyos valores típicos bajo la alternativa son poco probables bajo nulo. (Un estadístico t positivo de 2 muestras lejos de 0 no sería sorprendente si la alternativa es verdadera, pero sorprendente si el nulo es verdadero.) Luego calculamos la distribución de muestreo del estadístico de prueba bajo el nulo, para que podamos calcular los valores p --- e interpretarlos. Cuando observamos un estadístico de prueba que es poco probable bajo nulo, especialmente si el diseño del estudio, el tamaño de la muestra, etc. fueron elegidos para tener un alto poder , esto proporciona alguna evidencia para la alternativa.

Entonces, ¿por qué no hablamos de "aceptar" la hipótesis alternativa? Porque incluso un estudio de gran potencia no proporciona una prueba completamente rigurosa de que el nulo está mal. Sigue siendo un tipo de evidencia, pero más débil que otros tipos de evidencia.

civilstat
fuente
7

Históricamente, hubo desacuerdo sobre si era necesaria una hipótesis alternativa. Permítanme explicar este punto de desacuerdo considerando las opiniones de Fisher y Neyman, dentro del contexto de las estadísticas frecuentistas, y una respuesta bayesiana.

  • Fisher - No necesitamos una hipótesis alternativa; simplemente podemos probar una hipótesis nula utilizando una prueba de bondad de ajuste. El resultado es un valor , que proporciona una medida de evidencia para la hipótesis nula.p

  • Neyman : debemos realizar una prueba de hipótesis entre un valor nulo y una alternativa. La prueba es tal que daría lugar a errores de tipo 1 a una velocidad fija y predeterminada, . El resultado es una decisión: rechazar o no rechazar la hipótesis nula en el nivel .αα

    Necesitamos una alternativa desde una perspectiva teórica de decisión: estamos haciendo una elección entre dos cursos de acción, y porque debemos informar el poder de la prueba Deberíamos buscar las pruebas más potentes posibles para tener la mejor oportunidad de rechazar cuando la alternativa es verdadera.

    1p(Accept H0|H1)
    H0

    Para satisfacer estos dos puntos, la hipótesis alternativa no puede ser la vaga 'no '.H0

  • Bayesiano : debemos considerar al menos dos modelos y actualizar su plausibilidad relativa con datos. Con solo un modelo, tenemos sin importar qué datos recolectemos. Para hacer cálculos en este marco, la hipótesis alternativa (o modelo como se conocería en este contexto) no puede ser la mal definida 'no '. Lo llamo mal definido ya que no podemos escribir el modelo .

    p(H0)=1
    H0p(data|not H0)

innisfree
fuente
1
Su último punto es excelente y, a menudo, se descuida en publicaciones que basan toda su argumentación en un único NHST desmotivado.
Konrad Rudolph
¿Por qué 'no ' está mal definido? H0
Michael
¿Qué es? ¿Puedes calcular ? p(data|notH0)
innisfree
@innisfree bajo la concepción frecuentista no, pero probablemente bajo Bayesian.
Michael
Intente hacerlo sin presentar al menos 2 modelos ...
innisfree
4

No estoy 100% seguro de si este es un requisito formal, pero generalmente la hipótesis nula y la hipótesis alternativa son: 1) complementarias y 2) exhaustivas. Es decir: 1) no pueden ser ambas verdaderas al mismo tiempo; 2) si uno no es verdadero, el otro debe ser verdadero.

Considere la prueba simple de alturas entre niñas y niños. Una hipótesis nula típica en este caso es que . Una hipótesis alternativa sería . Entonces, si nulo no es verdadero, la alternativa debe ser verdadera.heightboys=heightgirlsheightboysheightgirls

Karolis Koncevičius
fuente
1
Estoy completamente de acuerdo con sus afirmaciones, pero uno debe tener en cuenta que tanto como suelen ser conjuntos infinitamente grandes de hipótesis nulas. También parece que muchos están convencidos de que y no necesitan ser exhaustivos, por ejemplo, ver esto o esta discusión. H0HaH0Ha
bi_scholar
2
@bi_scholar gracias por los hilos de discusión. No soy un experto en esto, pero basándome en un razonamiento simple, creo que tienen que ser exhaustivos. Considere esta extraña prueba: alguien encuentra 5 rocas dispuestas en orden en una carretera. Su : viento hizo esto. Su : eran extraterrestres. Ahora, si prueba la posibilidad de que el viento haya hecho esto y encuentre una probabilidad de 0,0001, rechaza la hipótesis del viento. Pero no le da derecho a afirmar que eran extraterrestres. Todo lo que puede decir es que la posibilidad de que sea viento es pequeña. Pero CUALQUIER otra explicación permanece abierta. H0H1
Karolis Koncevičius
1
Estoy de acuerdo. Mi razonamiento fue que la prueba de hipótesis se trata de aceptar o rechazar mientras se rechaza o acepta . Si y no son exhaustivos, no tiene sentido definir en absoluto, ya que incluso cuando rechazamos no podemos aceptar , ya que existen otras hipótesis fuera de y que también podrían ser ciertas. Desafortunadamente no logré expresar mi punto de vista en el primer hilo. H0HaH0HaHaH0HaH0Ha
bi_scholar
1
@innisfree uno podría probar hipótesis de dos puntos en algún tipo de marco de probabilidad, claro. Pero ese procedimiento no se llamaría "prueba de hipótesis nula" y es impreciso. Seleccionaría el más cercano como verdadero incluso en los casos en que ninguno de ellos sea verdadero. Además, con respecto al poder: se puede elegir una hipótesis alternativa o el tamaño del efecto al calcular el poder de la prueba, pero (en mi opinión) debería olvidarlo una vez que se realiza la prueba. A menos que haya alguna información previa que le informe sobre los posibles efectos presentes en los datos. Como tal vez píxeles blancos / negros en una foto ruidosa.
Karolis Koncevičius
1
@innisfree Tengo curiosidad por cómo se vería tal prueba, ¿podría formular un pequeño ejemplo? Estoy convencido de que no podemos aceptar rechazando menos que que corresponda a y sea ​​exhaustivo. θ=1H0θ{0,1}H0H1
bi_scholar
2

¿Por qué necesitamos tener hipótesis alternativas?

En una prueba de hipótesis clásica, el único papel matemático desempeñado por la hipótesis alternativa es que afecta el orden de la evidencia a través de la estadística de prueba elegida. La hipótesis alternativa se utiliza para determinar el estadístico de prueba apropiado para la prueba, que es equivalente a establecer una clasificación ordinal de todos los resultados de datos posibles de los más propicios para la hipótesis nula (en contra de la alternativa establecida) a los menos propicios para las hipótesis nulas (en contra de la alternativa indicada). Una vez que haya formado esta clasificación ordinal de los posibles resultados de datos, la hipótesis alternativa ya no juega un papel matemático adicional en la prueba .


Explicación formal: en cualquier prueba de hipótesis clásica connx=(x1,...,xn)T:RnRque mapea cada resultado posible de los datos en una escala ordinal que mide si es más propicio para la hipótesis nula o alternativa. (Sin pérdida de generalidad, asumiremos que los valores más bajos son más propicios para la hipótesis nula y los valores más altos son más propicios para la hipótesis alternativa. A veces decimos que los valores más altos del estadístico de prueba son "más extremos" en la medida en que constituyen más extremos evidencia de la hipótesis alternativa.) El valor p de la prueba viene dado por:

p(x)pT(x)P(T(X)T(x)|H0).

Esta función de valor p determina completamente la evidencia en la prueba para cualquier vector de datos. Cuando se combina con un nivel de significancia elegido, determina el resultado de la prueba para cualquier vector de datos. (Hemos descrito esto para un número fijo de puntos de datos pero esto puede extenderse fácilmente para permitir arbitraria ). Es importante tener en cuenta que el valor p se ve afectado por el estadístico de prueba solo a través de la escala ordinal que inducenn, por lo tanto, si aplica una transformación monotónicamente creciente a las estadísticas de la prueba, esto no hace ninguna diferencia con la prueba de hipótesis (es decir, es la misma prueba). Esta propiedad matemática simplemente refleja el hecho de que el único propósito del estadístico de prueba es inducir una escala ordinal en el espacio de todos los posibles vectores de datos, para mostrar cuáles son más propicios para la nula / alternativa.

La hipótesis alternativa afecta esta medición solo a través de la funciónT , que se elige en base a las hipótesis nulas y alternativas establecidas dentro del modelo general. Por lo tanto, podemos considerar la función estadística de prueba como una función del modelo general y las dos hipótesis. Por ejemplo, para una prueba de razón de verosimilitud, el estadístico de prueba se forma tomando una razón (o logaritmo de una razón) de supremums de la función de verosimilitud sobre rangos de parámetros relacionados con las hipótesis nula y alternativa.Tg(M,H0,HA)M


¿Qué significa esto si comparamos pruebas con diferentes alternativas? Suponga que tiene un modelo fijo y desea hacer dos pruebas de hipótesis diferentes comparando la misma hipótesis nula con dos alternativas diferentes y . En este caso, tendrá dos funciones estadísticas de prueba diferentes:MH0HAHA

T=g(M,H0,HA)T=g(M,H0,HA),

que conduce a las funciones de valor p correspondientes:

p(x)=P(T(X)T(x)|H0)p(x)=P(T(X)T(x)|H0).

Es importante tener en cuenta que si y son monotónicas transformaciones crecientes de uno otro, entonces las funciones p-valor y son idénticos, por lo que ambas pruebas son la misma prueba. Si las funciones y no son transformaciones monotónicas crecientes entre sí, entonces tenemos dos pruebas de hipótesis genuinamente diferentes.TTppTT

Ben - Restablece a Monica
fuente
2
Estoy de acuerdo con esto, diciendo que la prueba está diseñada para rechazar la hipótesis nula cuando se enfrenta a resultados extremos, y el papel de la hipótesis alternativa es señalar en qué resultados los resultados serían vistos como extremos si la hipótesis nula fuera cierta
Henry
1

La razón por la que no pensaría en aceptar la hipótesis alternativa es porque eso no es lo que estamos probando. La prueba de significación de hipótesis nulas (NHST) calcula la probabilidad de observar datos tan extremos como los observados (o más) dado que la hipótesis nula es verdadera, o en otras palabras, NHST calcula un valor de probabilidad que está condicionado al hecho de que la hipótesis nula es verdadera , . Por lo tanto, es la probabilidad de que los datos supongan que la hipótesis nula es verdadera. Nunca usa o da la probabilidad de una hipótesis (ni nula ni alternativa). Por lo tanto, cuando observa un valor p pequeño, todo lo que sabe es que los datos que observó parecen poco probables enP(data|H0)H0, por lo que está recopilando pruebas contra el nulo y a favor de cualquiera que sea su explicación alternativa.

Antes de ejecutar el experimento, puede decidir un nivel de corte ( ) que considere que resulta significativo, lo que significa que si su valor p cae por debajo de ese nivel, concluye que la evidencia contra el nulo es tan abrumadoramente alta que los datos deben haberse originado de algún otro proceso de generación de datos y usted rechaza la hipótesis nula basada en esa evidencia. Si el valor p está por encima de ese nivel, no puede rechazar la hipótesis nula, ya que su evidencia no es lo suficientemente sustancial como para creer que su muestra proviene de un proceso de generación de datos diferente.α

La razón por la que formula una hipótesis alternativa es porque probablemente tenía un experimento en mente antes de comenzar a tomar muestras. La formulación de una hipótesis alternativa también puede decidir si usa una prueba de una o dos colas y, por lo tanto, le da más poder estadístico (en el escenario de una cola). Pero técnicamente para ejecutar la prueba no necesita formular una hipótesis alternativa, solo necesita datos.

Stefan
fuente
NHST no calcula ; calcula . La distinción es importante. P ( datos tan extremos como los observados | H 0 )P(data|H0)P(data as extreme as that observed|H0)
innisfree
@innisfree Estoy de acuerdo y así es exactamente como definí los datos en esa misma oración.
Stefan
? No puedo ver en cualquier lugar en el que se definen los datos (de esa manera o de otra manera)
innisfree
E incluso si lo fuera, ¿por qué hacer eso? ¿Por qué redefinir datos de esa manera? Aconsejaría aclarar las partes del texto alrededor de p (datos ..
innisfree