Estoy comparando dos grupos de mutantes, cada uno de los cuales puede tener solo uno de los 21 fenotipos diferentes. Me gustaría ver si la distribución de estos resultados es similar entre dos grupos. Encontré una prueba en línea que calcula la "prueba de Chi-cuadrado para la igualdad de distribuciones" y me da algunos resultados plausibles. Sin embargo, tengo bastantes ceros en esta tabla, ¿puedo usar chi-cuadrado en este caso?
Aquí está la tabla con dos grupos y recuentos de fenotipos particulares:
2 1
2 3
1 6
1 4
13 77
7 27
0 1
0 4
0 2
2 7
2 3
1 5
1 9
2 6
0 3
3 0
1 3
0 3
1 0
1 2
0 1
Respuestas:
Perfectamente factible en estos días para hacer la prueba 'exacta' de Fisher en una mesa de este tipo. Acabo de obtener p = 0.087 usando Stata (
tabi 2 1 \ 2 3 \ .... , exact
. La ejecución tomó 0.19 segundos).EDITAR después del comentario de chl a continuación (intenté agregarlo como comentario pero no puedo formatear):
Funciona en R 2.12.0 para mí, aunque tuve que aumentar la opción 'espacio de trabajo' sobre su valor predeterminado de 200000:
(El tiempo de ejecución es un poco más rápido que en Stata, pero eso es de dudosa relevancia dado el tiempo necesario para calcular el significado del mensaje de error, que usa 'espacio de trabajo' para significar algo diferente del significado habitual de R a pesar del hecho de que fisher.test es parte del paquete principal de 'estadísticas' de R.)
fuente
Las pautas habituales son que los recuentos esperados deben ser superiores a 5, pero puede ser algo relajado como se analiza en el siguiente artículo:
Ver también la página de inicio de Ian Campbell .
chisq.test(..., sim=TRUE)
En su caso, parece que aproximadamente el 80% de los recuentos esperados están por debajo de 5, y el 40% están por debajo de 1. ¿Tendría sentido agregar algunos de los fenotipos observados?
fuente