Un valor p es la probabilidad de obtener una estadística que sea al menos tan extrema como la observada en los datos de la muestra cuando se asume que la hipótesis nula ( ) es verdadera.
Gráficamente esto corresponde al área definida por el estadístico de muestra bajo la distribución de muestreo que se obtendría al asumir :
Sin embargo, debido a que la forma de esta distribución supuesta se basa realmente en los datos de muestra, centrarla en parece una elección extraña.
Si, en cambio, se usa la distribución de muestreo de la estadística, es decir, se centra la distribución en la estadística de la muestra, entonces la prueba de hipótesis correspondería a la estimación de la probabilidad de dadas las muestras.
En ese caso, el valor p es la probabilidad de obtener una estadística al menos tan extrema como dados los datos en lugar de la definición anterior.
Además, dicha interpretación tiene la ventaja de relacionarse bien con el concepto de intervalos de confianza:
una prueba de hipótesis con un nivel de significancia sería equivalente a verificar si cae dentro del intervalo de confianza de la distribución de muestreo.
Por lo tanto, creo que centrar la distribución en podría ser una complicación innecesaria.
¿Hay alguna justificación importante para este paso que no haya considerado?
Respuestas:
Supongamos que es una muestra extraída de una distribución normal con media desconocida y varianza conocida . La media de la muestra es, por lo tanto, normal con media y varianza . Sobre esto, creo que no puede haber desacuerdo.X=(X1,X2,…,Xn) μ σ2 X¯ μ σ2/n
Ahora, propone que nuestra estadística de prueba sea ¿Derecha? PERO ESTO NO ES UNA ESTADÍSTICA . ¿Por qué? Porque es un parámetro desconocido . Una estadística es una función de la muestra que no depende de ningún parámetro desconocido. Por lo tanto, se debe hacer una suposición acerca de para que sea una estadística. Uno de estos supuestos es escribir bajo el cual que es una estadística.
Por el contrario, propone utilizar sí. En ese caso, idéntica, y ni siquiera es una variable aleatoria, y mucho menos distribuida normalmente. No hay nada que probar.μ=X¯ Z=0
fuente
Esto en realidad no es cierto. La forma de esta distribución asumida proviene de aceptar como verdadero.H0
La muestra no está directamente involucrada en eso, salvo por algunos supuestos.Usar la muestra directamente no es suficiente. También necesita la hipótesis nula para mantener.La pregunta es: ¿cómo estimas una probabilidad de algo que supones que es verdad? En nuestro caso, si supone que es verdadero, es inútil tratar de estimar la probabilidad de que sea verdadero.H0 H0
No tiene dos distribuciones allí, solo hay una, la que se supone que es su verdad fundamental, también conocida como la que viene con . Sin embargo, existe una distribución de muestreo derivada de la muestra, pero esto no está involucrado en las hipótesis que utiliza.H0
Un buen ejercicio sería tratar de replicar la misma lógica con una distribución asimétrica. Tome la distribución de chi-cuadrado como en la prueba de independencia de chi cuadrado. ¿Eres capaz de reproducirlo? Creo que la respuesta es no.
fuente
Por lo que deduzco, usted argumenta que tiene más sentido 'voltear' y .H0 H1
Me resulta útil pensar en la prueba de hipótesis como una prueba por contradicción. Suponemos que es cierto, luego mostramos que la evidencia indica que tal suposición es defectuosa, lo que justifica el rechazo de a favor de .H0 H0 H1
Esto funciona porque cuando asumimos y nuestra distribución allí, podemos determinar qué tan probable / improbable es nuestra observación. Por ejemplo, si vs. y determinamos a partir de nuestras pruebas que existe una probabilidad menor de 5% de que la media real igual a 0, podemos rechazar con 95 % confianza.H0 H0:μ=0 H1:μ≠0 μ H0
Lo contrario no es necesariamente cierto. Digamos que hacemos un experimento y determinamos que en realidad hay un 30% de posibilidades de que la hipótesis nula aún se mantenga. No podemos rechazar el nulo, pero tampoco lo aceptamos . Esta situación no muestra que (el nulo) sea verdadero, pero que no tenemos la evidencia para demostrar que es falso.H0
Ahora imagina si volteamos esta situación. Supongamos que asumimos y descubrimos que, dados nuestros resultados, la probabilidad de es del 5% o menos, ¿qué significa eso? Claro que podemos rechazar el nulo, ¿podemos aceptar necesariamente ? Es difícil justificar aceptar lo que asumimos que es verdad al principio.H1 H0 H1
Mostrar que es falso no es el resultado que buscamos; queremos argumentar a favor de . Al hacer la prueba de la manera que usted describe, estamos demostrando que no tenemos evidencia para decir que es falso, lo cual es sutilmente diferente de argumentar que es verdadero.H0 H1 H1 H1
fuente