Estoy probando la igualdad de medios usando la prueba t de Welch. La distribución subyacente está lejos de ser normal (más sesgada que el ejemplo en una discusión relacionada aquí ). Puedo obtener más datos, pero me gustaría conocer alguna forma de determinar en qué medida hacerlo.
- ¿Existe una buena heurística para evaluar que la distribución de la muestra es aceptable? ¿Qué desviaciones de la normalidad son más preocupantes?
- ¿Existen otros enfoques, por ejemplo, confiar en un intervalo de confianza de arranque para la estadística de muestra, que tendrían más sentido?
Respuestas:
Como la prueba t asume la normalidad, y sus distribuciones subyacentes no son normales, no puede haber una forma de principio de determinar que la distribución de la muestra es aceptable. Sin embargo, a medida que el tamaño de la muestra se vuelve "grande", el Teorema del límite central entra en acción y puede usar una prueba z de muestra grande, que esencialmente le dará la misma respuesta que una prueba t porque la t se acerca a la distribución normal con Muestras grandes.
Los libros / cursos de estadísticas a menudo implican que con un tamaño de muestra de 25 o 30 CLT entra en juego de una manera útil. Sin embargo, mi experiencia ha sido que incluso con tamaños de muestra en los cientos de muestras grandes, las pruebas z aún pueden ser bastante pobres (por ejemplo, con datos de recuento).
En mi opinión, una prueba de permutación se adapta bien a su problema. Debe tener una potencia igual o mejor que las pruebas no paramétricas enlatadas (por ejemplo, Mann-Whitney) y no tiene que preocuparse por el problema de la normalidad. Y, son divertidos de escribir.
fuente