Prueba de hipótesis. ¿Por qué centrar la distribución de muestreo en H0?

9

Un valor p es la probabilidad de obtener una estadística que sea al menos tan extrema como la observada en los datos de la muestra cuando se asume que la hipótesis nula ( ) es verdadera.H0

Gráficamente esto corresponde al área definida por el estadístico de muestra bajo la distribución de muestreo que se obtendría al asumir :H0

centro h0

Sin embargo, debido a que la forma de esta distribución supuesta se basa realmente en los datos de muestra, centrarla en parece una elección extraña. Si, en cambio, se usa la distribución de muestreo de la estadística, es decir, se centra la distribución en la estadística de la muestra, entonces la prueba de hipótesis correspondería a la estimación de la probabilidad de dadas las muestras.μ0
μ0

centro h1

En ese caso, el valor p es la probabilidad de obtener una estadística al menos tan extrema como dados los datos en lugar de la definición anterior.μ0

Además, dicha interpretación tiene la ventaja de relacionarse bien con el concepto de intervalos de confianza:
una prueba de hipótesis con un nivel de significancia sería equivalente a verificar si cae dentro del intervalo de confianza de la distribución de muestreo.αμ0(1α)

CI2 95

Por lo tanto, creo que centrar la distribución en podría ser una complicación innecesaria. ¿Hay alguna justificación importante para este paso que no haya considerado?μ0

matti
fuente
2
Díganos cuál será la distribución de muestreo si no asume . (Respuesta: no puede, excepto en ejemplos de libros de texto donde la hipótesis alternativa especifica una distribución única.)H0
whuber
No estoy seguro si entiendo la solicitud correctamente, pero en el ejemplo anterior sería la distribución muestral de la media. Ahora he agregado una figura a la pregunta que muestra esta distribución junto con un intervalo / área de confianza del 95% que también debería ayudar a ilustrar la relación con los intervalos de confianza.
matti
2
No tiene forma de conocer la distribución muestral de la media. Para saber eso, necesitas saber el verdadero significado: ¡pero esa es precisamente la cantidad que estás tratando de probar! Tu lógica es completamente circular.
whuber
1
Entendí que ese era tu significado. En general, hasta que conozca, o asuma, los parámetros verdaderos de la distribución, no podrá conocer la distribución de ninguna propiedad de la muestra. (De hecho, si pudiera deducir la distribución de cualquier propiedad de muestra sin asumir el conocimiento de los parámetros, ¡eso sería una prueba de que no le da información sobre los parámetros!)
whuber
1
No puedo, porque parece que no estás usando términos como "media", "estimado" o incluso "H0" en sus sentidos estadísticos habituales. Estoy completamente perdido para comprender incluso cuál es su pregunta. Lo único que está claro es que se basa en un malentendido de la prueba de hipótesis nulas, pero sus respuestas a mis comentarios no han proporcionado ninguna indicación útil de lo que podría ser ese malentendido.
whuber

Respuestas:

5

Supongamos que es una muestra extraída de una distribución normal con media desconocida y varianza conocida . La media de la muestra es, por lo tanto, normal con media y varianza . Sobre esto, creo que no puede haber desacuerdo.X=(X1,X2,,Xn)μσ2X¯μσ2/n

Ahora, propone que nuestra estadística de prueba sea ¿Derecha? PERO ESTO NO ES UNA ESTADÍSTICA . ¿Por qué? Porque es un parámetro desconocido . Una estadística es una función de la muestra que no depende de ningún parámetro desconocido. Por lo tanto, se debe hacer una suposición acerca de para que sea ​​una estadística. Uno de estos supuestos es escribir bajo el cual que es una estadística.

Z=X¯μσ/nNormal(0,1).
μμZ
H0:μ=μ0,vs.H1:μμ0,
ZH0=X¯μ0σ/nNormal(0,1),

Por el contrario, propone utilizar sí. En ese caso, idéntica, y ni siquiera es una variable aleatoria, y mucho menos distribuida normalmente. No hay nada que probar.μ=X¯Z=0

heropup
fuente
1
Gracias. Esto es muy sencillo y ahora realmente me pregunto cómo podría haberme perdido eso antes. Todo lo que quedaría ahora como excusa para el segundo caso presentado es confiar en el cálculo del intervalo de confianza. Sin embargo, debido a que el margen de error se suma / resta explícitamente de la estimación media o puntual, el uso de esa estimación se convierte en un paso que debería justificarse.
matti
12

Sin embargo, debido a que la forma de esta distribución supuesta se basa realmente en los datos de la muestra, centrarla en H0 me parece una elección extraña.

Esto en realidad no es cierto. La forma de esta distribución asumida proviene de aceptar como verdadero.H0La muestra no está directamente involucrada en eso, salvo por algunos supuestos.Usar la muestra directamente no es suficiente. También necesita la hipótesis nula para mantener.

Si, en cambio, se utilizara la distribución muestral del estadístico, es decir, centrar la distribución en el estadístico muestral, entonces la prueba de hipótesis correspondería a la estimación de la probabilidad de H0 dadas las muestras.

La pregunta es: ¿cómo estimas una probabilidad de algo que supones que es verdad? En nuestro caso, si supone que es verdadero, es inútil tratar de estimar la probabilidad de que sea ​​verdadero.H0H0

Por lo tanto, creo que centrar la distribución en H0 es una complicación innecesaria.

No tiene dos distribuciones allí, solo hay una, la que se supone que es su verdad fundamental, también conocida como la que viene con . Sin embargo, existe una distribución de muestreo derivada de la muestra, pero esto no está involucrado en las hipótesis que utiliza.H0

Un buen ejercicio sería tratar de replicar la misma lógica con una distribución asimétrica. Tome la distribución de chi-cuadrado como en la prueba de independencia de chi cuadrado. ¿Eres capaz de reproducirlo? Creo que la respuesta es no.

rapaio
fuente
" Esto en realidad no es cierto. La forma de esta distribución asumida proviene de aceptar H0 como verdadero. La muestra no está directamente involucrada en eso, salvo por algunos supuestos " . Pero en el caso de la prueba t de una muestra presentada anteriormente, la El estadístico de prueba incluye el SEM y la media muestral y, por lo tanto, depende de los datos de la muestra. Además, los grados de libertad que determinan la altura de las colas dependen del tamaño de la muestra.
t=x¯μ0sn
matti
1
Mi formulación fue engañosa. Intenté decir que puede usar cualquier información que tenga, también la muestra en sí, pero no es suficiente. Para evaluar los valores p y tener una distribución, debe asumir también la hipótesis nula. Reformulo en el post también.
rapaio
1
... Tome por ejemplo su fórmula para , usa que supongo que es el valor de la hipótesis nulatμ0H0:μ=μ0
rapaio
2

Por lo que deduzco, usted argumenta que tiene más sentido 'voltear' y .H0H1

Me resulta útil pensar en la prueba de hipótesis como una prueba por contradicción. Suponemos que es cierto, luego mostramos que la evidencia indica que tal suposición es defectuosa, lo que justifica el rechazo de a favor de .H0H0H1

Esto funciona porque cuando asumimos y nuestra distribución allí, podemos determinar qué tan probable / improbable es nuestra observación. Por ejemplo, si vs. y determinamos a partir de nuestras pruebas que existe una probabilidad menor de 5% de que la media real igual a 0, podemos rechazar con 95 % confianza.H0H0:μ=0H1:μ0μH0

Lo contrario no es necesariamente cierto. Digamos que hacemos un experimento y determinamos que en realidad hay un 30% de posibilidades de que la hipótesis nula aún se mantenga. No podemos rechazar el nulo, pero tampoco lo aceptamos . Esta situación no muestra que (el nulo) sea verdadero, pero que no tenemos la evidencia para demostrar que es falso.H0

Ahora imagina si volteamos esta situación. Supongamos que asumimos y descubrimos que, dados nuestros resultados, la probabilidad de es del 5% o menos, ¿qué significa eso? Claro que podemos rechazar el nulo, ¿podemos aceptar necesariamente ? Es difícil justificar aceptar lo que asumimos que es verdad al principio.H1H0H1

Mostrar que es falso no es el resultado que buscamos; queremos argumentar a favor de . Al hacer la prueba de la manera que usted describe, estamos demostrando que no tenemos evidencia para decir que es falso, lo cual es sutilmente diferente de argumentar que es verdadero.H0H1H1H1

Bryan Goggin
fuente
Como la prueba de hipótesis no nos permite eliminar completamente la incertidumbre, no lo vería como una prueba . Quizás no he dejado mi punto lo suficientemente claro, pero esencialmente estoy pidiendo una razón lógica en lugar de semántica para cambiar la distribución de muestreo a . H0
matti
Y en general, H1 es bastante vago (mu! = 0), lo que hace que los cálculos de probabilidad sean problemáticos. Aunque supongo que a menudo es un buen incentivo para que las personas se vuelvan bayesianas. :)
Hao Ye