He realizado un experimento para estudiar la respuesta de una levadura (que contiene 5000 genes) al estrés causado por el choque térmico. Tengo una lista de 48 genes que se sobreexpresan a 37ºC y otra lista de 145 genes que se sobreexpresan a 42ºC. Hay 38 genes que están sobreexpresados en ambos.
Por casualidad, esperaba solo 1 gen sobreexpresado en ambos, ¿cómo puedo calcular si la superposición que he obtenido es significativamente? ¿Cómo puedo obtener el valor ? No sé nada sobre software bioestadístico o matemático. ¡¡¡Muchas gracias!!! Cualquier ayuda será muy bienvenida :)
Respuestas:
La mesa se ve así
sí y no se refieren a casos sobreexpresados o no Ejecuté la prueba exacta de Fisher en SAS El resultado se pega a continuación:
Aquí puede ver que el valor p para la prueba exacta de Fisher es muy pequeño, mucho menor que 0.0001.
Esto muestra exactamente lo que dijo que los 38 sobreexpresados observados a ambas temperaturas es mucho mayor de lo que espera bajo independencia, que como dijo sería 1.296.
fuente
La prueba exacta a la que hace referencia Michael es probablemente la forma en que recomendaría usar para resolver el problema (la menor cantidad de supuestos). Como referencia, la prueba estadística común correspondiente sería unχ2 prueba de independencia .
fuente