Tengo datos para dos grupos (es decir, muestras) que deseo comparar, pero el tamaño total de la muestra es pequeño (n = 29) y muy desequilibrado (n = 22 vs n = 7).
Estos datos son logísticamente difíciles y caros de recopilar, por lo que, aunque 'recopilar más datos' como solución obvia no es útil en este caso.
Se midieron varias variables diferentes (fecha de salida, fecha de llegada, duración de la migración, etc.), por lo que hay múltiples pruebas, algunas de las cuales las variaciones son muy diferentes (la muestra más pequeña tiene una varianza más alta).
Inicialmente, un colega realizó pruebas t de estos datos, y algunos fueron estadísticamente significativos con P <0.001, otro no fue significativo con P = 0.069. Algunas muestras se distribuyeron normalmente, otras no. Algunas pruebas implicaron grandes desviaciones de las variaciones "iguales".
Tengo varias preguntas
- ¿Son apropiadas las pruebas t aquí? Si no, ¿por qué? ¿Esto se aplica solo a las pruebas en las que se cumplen los supuestos de normalidad e igualdad de varianzas?
- ¿Cuál es una alternativa adecuada? Tal vez una prueba de permutación?
- la variación desigual infla el error Tipo I, pero ¿cómo? ¿Y qué efecto tiene el tamaño de muestra pequeño y desequilibrado en el error Tipo I?
fuente
Primero, como Scortchi ya señala, la prueba T no se adapta tan bien a sus datos, debido a sus supuestos sobre la distribución de los datos.
Para su segundo punto, propondría una alternativa a la prueba T. Si solo le interesa el hecho, si las distribuciones de sus dos muestras son iguales o no, también puede intentar usar la versión de dos lados de la prueba de suma de rango de Wilcoxon. La prueba de suma de rango de Wilcoxon es una prueba no paramétrica. Este tipo de prueba es especialmente útil si no está seguro de la distribución subyacente de sus datos.
Existe una solución exacta de la prueba para tamaños de muestra pequeños, así como para grandes cohortes. Además, también existe un paquete R que realiza la prueba de suma de rangos de Wilcoxon.
Como es una prueba sin parámetros y también maneja tamaños de muestra pequeños, la prueba debería ser adecuada para su caso de prueba.
fuente