Me han enseñado que podemos producir una estimación de parámetros en forma de un intervalo de confianza después del muestreo de una población. Por ejemplo, los intervalos de confianza del 95%, sin supuestos violados, deberían tener una tasa de éxito del 95% de contener cualquier parámetro verdadero que estemos estimando en la población.
Es decir,
- Produzca una estimación puntual a partir de una muestra.
- Produzca un rango de valores que teóricamente tenga un 95% de posibilidades de contener el valor verdadero que estamos tratando de estimar.
Sin embargo, cuando el tema se convirtió en prueba de hipótesis, los pasos se describieron de la siguiente manera:
- Suponga algún parámetro como la hipótesis nula.
- Produzca una distribución de probabilidad de la probabilidad de obtener varias estimaciones puntuales dado que esta hipótesis nula es verdadera.
- Rechace la hipótesis nula si la estimación puntual que obtenemos se produciría menos del 5% del tiempo si la hipótesis nula es cierta.
Mi pregunta es esta:
¿Es necesario producir nuestros intervalos de confianza utilizando la hipótesis nula para rechazar la nula? ¿Por qué no simplemente hacer el primer procedimiento y obtener nuestra estimación para el parámetro verdadero (sin usar explícitamente nuestro valor hipotético en el cálculo del intervalo de confianza) y luego rechazar la hipótesis nula si no cae dentro de este intervalo?
Esto me parece lógicamente equivalente intuitivamente, pero me temo que me estoy perdiendo algo muy fundamental, ya que probablemente hay una razón por la que se enseña de esta manera.
Respuestas:
Al mismo tiempo, el evento en la primera línea de la pantalla es precisamente también el evento de que la hipótesis nula no se rechaza para este . Como el resto solo contiene reformulaciones equivalentes, el ci de hecho contiene todo para el cual no se rechaza el valor nulo, y no se necesita ninguna referencia a "debajo del valor nulo".μ μ
Aquí hay una trama análoga a la visualización +1 de Martijn con el objetivo de mostrar lo que se conoce como dualidad entre los intervalos de confianza y las pruebas. denota el intervalo de confianza que pertenece a alguna y la región de aceptación que pertenece a alguna hipótesis .C X¯∗ A ( μ0 0) μ = μ0 0
fuente
Sí, puede reemplazar una prueba de hipótesis (comparación de la muestra con una distribución hipotética de los resultados de la prueba) por una comparación con un intervalo de confianza calculado a partir de la muestra. Pero indirectamente, un intervalo de confianza ya es una especie de prueba de hipótesis, a saber:
La consecuencia de hacer tal rango es que el rango solo falla una fracción del tiempo.α
Ejemplo
Estoy usando una imagen de una respuesta a la siguiente pregunta: Intervalos de confianza: cómo tratar formalmente conPAG( L ( X ) ≤ θ , U( X ) ≥ θ ) = 1 - α
Es una variación de un gráfico de Clopper-Pearson . Imagínese el caso de 100 ensayos de Bernoulli donde la probabilidad de éxito es y observamos el número total de éxitos .θ X
Tenga en cuenta que:
En la dirección vertical se ve la prueba de hipótesis. Por ejemplo, para un valor hipotético dado , rechaza la hipótesis si la medida está por encima o por debajo de las líneas punteadas rojas o verdes.θ X
En la dirección horizontal , verá los intervalos de confianza de Clopper-Pearson. Si para cualquier observación X usa estos intervalos de confianza, se equivocará solo el 5% del tiempo
(porque solo observará esa X, en la que basa un intervalo 'incorrecto', el 5% del tiempo)
fuente