¿Por qué es necesaria una prueba t dado que tenemos la prueba z?

9

¿Alguien puede dar una explicación de por qué la prueba t "sucede"? Me enseñaron a usar la prueba t cuando no conoce la desviación estándar de la población (es decir, solo conoce la desviación estándar de su muestra), pero no estoy seguro de por qué eso lo haría diferente de una prueba z .

jasonbogd
fuente
He actualizado su título para llegar a la pregunta que creo que está haciendo; no dude en editar si he malinterpretado
Jeromy Anglim

Respuestas:

3

No creo entender tu pregunta por completo. ¿Estás preguntando por qué usarías una prueba t?

Si comprende por qué usaría una prueba z, debería tener una buena idea de por qué usaría una prueba t. Para muestras grandes, una prueba z y una prueba t deberían generar resultados similares o idénticos. Pero mientras que una prueba z asumirá una distribución normal, una prueba t tomará en cuenta la incertidumbre en la distribución de muestras en tamaños de muestras más pequeños.

Benjamin Mako Hill
fuente
3
Hmm, la prueba t también supone una distribución normal. Quizás lo que quisiste decir es que necesitamos menos información sobre esa distribución.
JohnK
@JohnK No creo que tenga sentido decir que una prueba supone una distribución en primer lugar, pero creo que Benjamin quiso decir que la puntuación t / estadística asume la distribución T y no la distribución Z.
Datoraki
3

La prueba z en sí misma es en realidad una prueba de razón de probabilidad entre la probabilidad asumiendo la hipótesis nula y la probabilidad asumiendo la hipótesis alternativa. Suponiendo distribuciones normales subyacentes con variaciones conocidas y solo probando las medias, el álgebra se simplifica a la prueba z que conocemos y amamos (DeGroot 1986, pp. 442-447).

Usar el mismo procedimiento de máxima verosimilitud, pero tratar la varianza como desconocida, crea un par diferente de verosimilitudes y su razón, y dejar que el álgebra se simplifique da la estadística: (DeGroot 1986, pp. 485–489). La distribución de prueba en cuestión también cambia, ya que el numerador de la estadística anterior se distribuye normalmente, , y el denominador se distribuye como la raíz cuadrada de las normales al cuadrado, , que es la raíz cuadrada de un variable aleatoria chi-cuadrado. Gosset (Estudiante) demostró que si tiene una variable aleatoria:

norte(X¯norte-μ0 0)Snorte2norte-1
X¯S2
Ynorte(0 0,1)Zχnorte2XYZnorte
entonces X se distribuye con la distribución t yn grados de libertad.

Entonces, para decirlo sin rigor, la prueba t es el resultado natural del mismo proceso de razón de probabilidad que está detrás de la prueba z cuando la varianza de los datos es desconocida y se estima a través de la máxima probabilidad.

Abraham
fuente
1
Esto fue muy esclarecedor. Me había olvidado por completo de que la prueba t proviene de la máxima probabilidad posible
Moderat
1

La respuesta no rigurosa es que desea utilizar una prueba t cuando tiene un pequeño número de muestras debido a la posibilidad de que las muestras estén inusualmente cercanas entre sí (en relación con la variación real de la población). En ese caso, el denominador en la fórmula para el estadístico t será inusualmente pequeño, por lo que el estadístico t en sí será inusualmente grande. Por lo tanto, es mucho más probable que obtenga un valor grande para la estadística t cuando tiene un pequeño número de muestras de lo que sería obtener una estadística z comparablemente grande, por lo que necesita un valor mayor para rechazar el valor nulo utilizando la prueba t que la prueba z al mismo nivel de significancia.

Evan Wright
fuente
El argumento me parece atractivo pero, después de reflexionar, poco convincente. Después de todo, si por casualidad las muestras están inusualmente separadas (lo que debería suceder tan fácilmente como estar inusualmente cerca), entonces parece que la misma lógica llevaría a la conclusión opuesta.
whuber