¿Podemos rechazar una hipótesis nula con intervalos de confianza producidos mediante muestreo en lugar de la hipótesis nula?

9

Me han enseñado que podemos producir una estimación de parámetros en forma de un intervalo de confianza después del muestreo de una población. Por ejemplo, los intervalos de confianza del 95%, sin supuestos violados, deberían tener una tasa de éxito del 95% de contener cualquier parámetro verdadero que estemos estimando en la población.

Es decir,

  1. Produzca una estimación puntual a partir de una muestra.
  2. Produzca un rango de valores que teóricamente tenga un 95% de posibilidades de contener el valor verdadero que estamos tratando de estimar.

Sin embargo, cuando el tema se convirtió en prueba de hipótesis, los pasos se describieron de la siguiente manera:

  1. Suponga algún parámetro como la hipótesis nula.
  2. Produzca una distribución de probabilidad de la probabilidad de obtener varias estimaciones puntuales dado que esta hipótesis nula es verdadera.
  3. Rechace la hipótesis nula si la estimación puntual que obtenemos se produciría menos del 5% del tiempo si la hipótesis nula es cierta.

Mi pregunta es esta:

¿Es necesario producir nuestros intervalos de confianza utilizando la hipótesis nula para rechazar la nula? ¿Por qué no simplemente hacer el primer procedimiento y obtener nuestra estimación para el parámetro verdadero (sin usar explícitamente nuestro valor hipotético en el cálculo del intervalo de confianza) y luego rechazar la hipótesis nula si no cae dentro de este intervalo?

Esto me parece lógicamente equivalente intuitivamente, pero me temo que me estoy perdiendo algo muy fundamental, ya que probablemente hay una razón por la que se enseña de esta manera.

Nikli
fuente
Mis disculpas por no estar claro, Martijn. Editaré mi publicación en breve para que sea más claro para las personas que busquen las mismas preguntas en el futuro. Lo que quise decir es que podemos calcular una estimación de parámetros a partir de una muestra, o podemos calcular un rango de estimaciones que consideraríamos para apoyar la hipótesis nula utilizando la hipótesis nula. No entendí por qué era necesario usar el valor nulo para ver si nuestra estimación puntual estaba en este intervalo, en lugar de simplemente usar nuestra estimación de parámetros y verificar si el valor nulo estaba dentro de los límites de la estimación de parámetros. ¡Espero que tenga sentido!
Nikli
Un experimento de pensamiento interesante es si alguien intenta venderte dados ponderados. Los hacen rodar, luego indican que están ponderados en la dirección que usted observa (por ejemplo, el 6 sale el 20% del tiempo). ¿Están ponderados (se hicieron suficientes lanzamientos de muestra), en cuánto y por qué vale hacer sus propias pruebas (adicionales) de lanzamiento de dados? El vendedor y el comprador tienen objetivos diferentes ...
Philip Oakley

Respuestas:

5

σ2=1Y¯-μnorte(0 0,1/ /norte)zα/ /2Φ(-zα/ /2)=α/ /2Φ(zα/ /2)=1-α/ /2

1-α=Pr{(X¯-μ)/ /(1/ /norte)(-zα/ /2,zα/ /2)}=Pr{-zα/ /2(X¯-μ)nortezα/ /2}=Pr{zα/ /2(μ-X¯)norte-zα/ /2}=Pr{-zα/ /2/ /norteμ-X¯zα/ /2/ /norte}=Pr{X¯-zα/ /2/ /norteμX¯+zα/ /2/ /norte}=Pr{(X¯-zα/ /2/ /norte,X¯+zα/ /2/ /norte)μ}
(X¯-zα/ /2/ /norte,X¯+zα/ /2/ /norte)
1-α

Al mismo tiempo, el evento en la primera línea de la pantalla es precisamente también el evento de que la hipótesis nula no se rechaza para este . Como el resto solo contiene reformulaciones equivalentes, el ci de hecho contiene todo para el cual no se rechaza el valor nulo, y no se necesita ninguna referencia a "debajo del valor nulo".μμ

Aquí hay una trama análoga a la visualización +1 de Martijn con el objetivo de mostrar lo que se conoce como dualidad entre los intervalos de confianza y las pruebas. denota el intervalo de confianza que pertenece a alguna y la región de aceptación que pertenece a alguna hipótesis .CX¯UNA(μ0 0)μ=μ0 0

ingrese la descripción de la imagen aquí

Christoph Hanck
fuente
10

Sí, puede reemplazar una prueba de hipótesis (comparación de la muestra con una distribución hipotética de los resultados de la prueba) por una comparación con un intervalo de confianza calculado a partir de la muestra. Pero indirectamente, un intervalo de confianza ya es una especie de prueba de hipótesis, a saber:

  • Puede ver que los intervalos de confianza se construyen como un rango de valores para los cuales una prueba de hipótesis de nivel tendría éxitoα y fuera del rango una prueba de hipótesis de nivel fallaría.α

La consecuencia de hacer tal rango es que el rango solo falla una fracción del tiempo.α

Ejemplo

Estoy usando una imagen de una respuesta a la siguiente pregunta: Intervalos de confianza: cómo tratar formalmente conPAG(L(X)θ,U(X)θ)=1-α

Es una variación de un gráfico de Clopper-Pearson . Imagínese el caso de 100 ensayos de Bernoulli donde la probabilidad de éxito es y observamos el número total de éxitos .θX

probabilidad fiducial

Tenga en cuenta que:

  • En la dirección vertical se ve la prueba de hipótesis. Por ejemplo, para un valor hipotético dado , rechaza la hipótesis si la medida está por encima o por debajo de las líneas punteadas rojas o verdes.θX

  • En la dirección horizontal , verá los intervalos de confianza de Clopper-Pearson. Si para cualquier observación X usa estos intervalos de confianza, se equivocará solo el 5% del tiempo

    (porque solo observará esa X, en la que basa un intervalo 'incorrecto', el 5% del tiempo)

Sexto empírico
fuente