¿Alguien puede dar una explicación de por qué la prueba t "sucede"? Me enseñaron a usar la prueba t cuando no conoce la desviación estándar de la población (es decir, solo conoce la desviación estándar de su muestra), pero no estoy seguro de por qué eso lo haría diferente de una prueba z .
hypothesis-testing
t-test
jasonbogd
fuente
fuente
Respuestas:
No creo entender tu pregunta por completo. ¿Estás preguntando por qué usarías una prueba t?
Si comprende por qué usaría una prueba z, debería tener una buena idea de por qué usaría una prueba t. Para muestras grandes, una prueba z y una prueba t deberían generar resultados similares o idénticos. Pero mientras que una prueba z asumirá una distribución normal, una prueba t tomará en cuenta la incertidumbre en la distribución de muestras en tamaños de muestras más pequeños.
fuente
La prueba z en sí misma es en realidad una prueba de razón de probabilidad entre la probabilidad asumiendo la hipótesis nula y la probabilidad asumiendo la hipótesis alternativa. Suponiendo distribuciones normales subyacentes con variaciones conocidas y solo probando las medias, el álgebra se simplifica a la prueba z que conocemos y amamos (DeGroot 1986, pp. 442-447).
Usar el mismo procedimiento de máxima verosimilitud, pero tratar la varianza como desconocida, crea un par diferente de verosimilitudes y su razón, y dejar que el álgebra se simplifique da la estadística: (DeGroot 1986, pp. 485–489). La distribución de prueba en cuestión también cambia, ya que el numerador de la estadística anterior se distribuye normalmente, , y el denominador se distribuye como la raíz cuadrada de las normales al cuadrado, , que es la raíz cuadrada de un variable aleatoria chi-cuadrado. Gosset (Estudiante) demostró que si tiene una variable aleatoria:
Entonces, para decirlo sin rigor, la prueba t es el resultado natural del mismo proceso de razón de probabilidad que está detrás de la prueba z cuando la varianza de los datos es desconocida y se estima a través de la máxima probabilidad.
fuente
La respuesta no rigurosa es que desea utilizar una prueba t cuando tiene un pequeño número de muestras debido a la posibilidad de que las muestras estén inusualmente cercanas entre sí (en relación con la variación real de la población). En ese caso, el denominador en la fórmula para el estadístico t será inusualmente pequeño, por lo que el estadístico t en sí será inusualmente grande. Por lo tanto, es mucho más probable que obtenga un valor grande para la estadística t cuando tiene un pequeño número de muestras de lo que sería obtener una estadística z comparablemente grande, por lo que necesita un valor mayor para rechazar el valor nulo utilizando la prueba t que la prueba z al mismo nivel de significancia.
fuente
Aquí se ofrece una buena descripción general de los supuestos y diferencias subyacentes (y similitudes) de ambas pruebas:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html
fuente