El otro día tuve una consulta con un epidemiólogo. Ella es un MD con un título de salud pública en epidemiología y tiene muchos conocimientos estadísticos. Ella asesora a sus compañeros de investigación y residentes y los ayuda con cuestiones estadísticas. Ella entiende las pruebas de hipótesis bastante bien. Tenía un problema típico de comparar dos grupos para ver si había una diferencia en el riesgo relacionado con tener insuficiencia cardíaca congestiva (ICC). Ella probó la diferencia media en la proporción de sujetos que recibieron CHF. El valor p fue de 0.08. Luego también decidió mirar el riesgo relativo y obtuvo un valor p de 0.027. Entonces ella preguntó por qué uno es significativo y el otro no. Mirando el 95% de los intervalos de confianza de dos lados para la diferencia y la relación, vio que el intervalo de diferencia media contenía 0 pero el límite superior de confianza para la relación era menor que 1. Entonces, ¿por qué obtenemos resultados inconsistentes? Mi respuesta, aunque técnicamente correcta, no fue muy satisfactoria. Dije: "Estas son estadísticas diferentes y pueden dar resultados diferentes. Los valores p están en el área de importancia marginal. Esto puede suceder fácilmente". Creo que debe haber mejores formas de responder esto en términos simples a los médicos para ayudarlos a comprender la diferencia entre probar el riesgo relativo y el riesgo absoluto. En los estudios de epi, este problema surge mucho porque a menudo miran eventos raros en los que las tasas de incidencia para ambos grupos son muy pequeñas y los tamaños de muestra no son muy grandes. He pensado un poco en esto y tengo algunas ideas que compartiré. Pero primero me gustaría saber cómo algunos de ustedes manejarían esto. Sé que muchos de ustedes trabajan o consultan en el campo de la medicina y probablemente se han enfrentado a este problema. ¿Qué harías?
fuente
Respuestas:
Bueno, por lo que ya ha dicho, creo que tiene todo cubierto, pero solo necesita ponerlo en su idioma: uno es una diferencia de riesgos, uno es una relación. Entonces, una prueba de hipótesis pregunta si mientras que la otra pregunta si p 2pag2- p1= 0 . A veces estos son "cercanos" a veces no. (Cierre entre comillas porque claramente no están cerca en el sentido aritmético habitual). Si el riesgo es raro, estos suelen estar "muy separados". por ejemplo.002/.001=2(lejos de 1) mientras.002-.001=.001(cerca de 0); pero si el riesgo es alto, estos son "cercanos":.2/.1=2(lejos de 0) y.2-.1=.1(también lejos de 0, al menos en comparación con el caso raro.pag2pag1= 1 .002 / .001 = 2 .002 - .001 = .001 .2 / .1 = 2 .2 - .1 = .1
fuente
Tenga en cuenta que en ambas pruebas, prueba una hipótesis completamente diferente con diferentes supuestos. Los resultados no son comparables, y ese es un error demasiado común.
En riesgo absoluto, usted prueba si la diferencia (promedio) en proporción difiere significativamente de cero. La hipótesis subyacente en la prueba estándar para esto supone que las diferencias de proporción se distribuyen normalmente. Esto podría ser válido para pequeñas proporciones, pero no para grandes. Técnicamente calcula la siguiente probabilidad condicional:
que es equivalente a probar la pendiente en el siguiente modelo logístico:
La razón por la que esto hace la diferencia se da en la respuesta de Peter Flom: una pequeña diferencia en los riesgos absolutos puede generar un gran valor para las probabilidades. Entonces, en su caso, significa que la proporción de personas que contraen la enfermedad no difiere sustancialmente, pero las probabilidades de estar en un grupo son significativamente mayores que las probabilidades de estar en el otro grupo. Eso es perfectamente sensato.
fuente
prop.test
(ochisq.test
como es equivalente en el caso de 2x2) yfisher.test
estar a más de 0.005 de distancia. Así que me pregunto qué pruebas usó ...