Tengo un conjunto de resultados de una prueba A / B (un grupo de control, un grupo de características) que no se ajustan a una Distribución Normal. De hecho, la distribución se parece más a la distribución de Landau.
Creo que la prueba t independiente requiere que las muestras estén al menos aproximadamente distribuidas normalmente, lo que me desalienta el uso de la prueba t como un método válido de prueba de significación.
Pero mi pregunta es: ¿en qué punto se puede decir que la prueba t no es un buen método de prueba de significación?
O dicho de otra manera, ¿cómo se puede calificar qué tan confiables son los valores p de una prueba t, dado solo el conjunto de datos?
fuente
Básicamente, se usa una prueba t independiente o una prueba t de 2 muestras para verificar si los promedios de las dos muestras son significativamente diferentes. O, para decirlo de otra manera, si hay una diferencia significativa entre las medias de las dos muestras.
Ahora, las medias de esas 2 muestras son dos estadísticas, que de acuerdo con CLT, tienen una distribución normal, si se proporcionan suficientes muestras. Tenga en cuenta que CLT funciona sin importar la distribución a partir de la cual se construye la estadística media.
Normalmente, se puede usar una prueba z, pero si las variaciones se estiman a partir de la muestra (porque es desconocida), se introduce cierta incertidumbre adicional, que se incorpora en la distribución t. Es por eso que la prueba t de 2 muestras se aplica aquí.
fuente