Estaba mirando este cuaderno y me sorprende esta afirmación:
Cuando hablamos de normalidad, lo que queremos decir es que los datos deberían verse como una distribución normal. Esto es importante porque varias pruebas estadísticas se basan en esto (por ejemplo, estadísticas t).
No entiendo por qué una estadística T necesita los datos para seguir una distribución normal.
De hecho, Wikipedia dice lo mismo:
La distribución t de Student (o simplemente la distribución t) es cualquier miembro de una familia de distribuciones de probabilidad continua que surge al estimar la media de una población normalmente distribuida
Sin embargo, no entiendo por qué esta suposición es necesaria.
Nada de su fórmula me indica que los datos tienen que seguir una distribución normal:
Miré un poco en su definición, pero no entiendo por qué la condición es necesaria.
fuente
Creo que puede haber cierta confusión entre la estadística y su fórmula, en comparación con la distribución y su fórmula. Puede aplicar la fórmula de estadística t a cualquier conjunto de datos y obtener una "estadística t", pero esta estadística no se distribuirá de acuerdo con la distribución t de student a menos que los datos provengan de una distribución normal (o al menos, no serán garantizado; mi suposición es que las distribuciones no normales no producirán una distribución de t de estudiante cuando se aplica la fórmula de estadística t, pero no estoy seguro de eso). La razón de esto es simplemente que la distribución de la estadística t se calcula a partir de la distribución de los datos que la generaron, por lo que si tiene una distribución subyacente diferente, no se garantiza que tenga la misma distribución para las estadísticas derivadas.
fuente