¿Qué prueba estadística se debe usar para evaluar el enriquecimiento de las listas de genes?

10

He realizado un experimento para probar la sensibilidad celular a un determinado agente de daño del ADN. Hemos encontrado 270 genes que eran específicamente sensibles al medicamento y el número total de genes analizados fue de 3668. 38 de los 270 genes sensibles se clasifican como "genes de reparación de ADN". Si el número de "genes de reparación de ADN" contenidos en el genoma es 112 y el número total de genes en el genoma es 3668, ¿son los genes sensibles enriquecimiento en genes de reparación de ADN? ¿Qué prueba estadística debe usarse? Le agradecería que también me dijera alguna herramienta para calcular el valor p en línea.

Laura
fuente

Respuestas:

17

La práctica estándar para evaluar el enriquecimiento de las listas de genes es hacer una prueba hipergeométrica o, de manera equivalente, una prueba exacta de Fisher unilateral . Tiene la siguiente tabla de contingencia :2×2

DNA RepairOtherSensitive38232270Not Sensitive74332433981123556

Puede realizar la prueba de la Rsiguiente manera:

fisher.test(matrix(c(38,74,232,3324),nrow=2,ncol=2),alternative="greater")

Lo que da un resultado muy significativo:

Fisher's Exact Test for Count Data

data:  matrix(c(38, 74, 232, 3324), nrow = 2, ncol = 2) 
p-value < 2.2e-16
alternative hypothesis: true odds ratio is greater than 1 
95 percent confidence interval:
5.062107      Inf 
sample estimates:
odds ratio 
7.34918

Tenga en cuenta que, como estamos probando la representación excesiva (en lugar de la representación insuficiente), el alternativeparámetro se establece en "greater".

M. Berk
fuente
1
Muchas gracias por tu respuesta. También pensé que la prueba exacta de Fisher podría ser un buen método para el análisis. No tengo ningún software estadístico para realizar los resultados para otras clases funcionales que me gustaría probar también. ¿Conoces alguna herramienta "en línea" para obtener los valores con todos los decimales?
Laura
1
Puedes descargar R gratis. Consulte r-project.org. Por lo tanto, no tener ningún software es soluble (y pensar que necesita una forma de calcular en línea es incorrecto). Pero busque un poco para descubrir estas cosas por sí mismo. Consulte los consejos en stats.stackexchange.com/help/how-to-ask para hacer una buena pregunta.
Nick Cox
@Nick Su consejo es bueno, pero no lo exprese como una caracterización del póster: tal frase es muy fácil de entender como un ataque, lo que dudo que haya querido. Por lo tanto, eliminé la frase preliminar en su comentario (que no le agregó información).
whuber
Una gran herramienta en línea para esto es: mathcelebrity.com/fishers_exact_test.php
¿Podría explicar, además, una representación excesiva de lo que se está calculando exactamente?
sdgaw erzswer