Interpretación del teorema de Bayes aplicado a los resultados positivos de la mamografía.

11

Estoy tratando de entender el resultado del Teorema de Bayes aplicado al clásico ejemplo de mamografía, con un giro perfecto de la mamografía.

Es decir,

Incidencia de cáncer:.01

Probabilidad de una mamografía positiva, dado que la paciente tiene cáncer:1

Probabilidad de una mamografía positiva, dado que la paciente no tiene cáncer:.01

Por Bayes:

P (cáncer | mamografía +) =1.01(1.01)+(.091.99)

=.5025

Entonces, si una persona aleatoria de la población toma la mamografía y obtiene un resultado positivo, ¿hay un 50% de posibilidades de que tenga cáncer? No entiendo intuitivamente cómo la pequeña probabilidad del 1% de un falso positivo en el 1% de la población puede desencadenar un resultado del 50%. Lógicamente, creo que una mamografía positiva verdadera con una tasa pequeña de falsos positivos sería mucho más precisa.

usuario2666425
fuente
2
La tasa de falsos positivos no es del 1%, sino del 99% de la población. Es por eso que obtienes una probabilidad que puede parecer baja, debido a la alta probabilidad previa de que alguien esté sano. También tenga en cuenta que esta es solo una prueba, ¿qué sucede si realiza la prueba más de una vez? Entonces la precisión de la prueba comienza a ser más importante.
dsaxton
Si es una mamografía perfecta, entonces la tasa de falsos positivos sería cero, y luego p (C | M) = 1 * 0.01 / (1 * 0.01 + 0 * 0.99) = 1.0 A medida que se acerca la tasa de falsos positivos de la mamografía perfección (0) entonces el segundo término en la parte inferior se acerca a cero. La tasa de falsos positivos 'pequeña' se combina con la tasa base igualmente pequeña para obtener el resultado contraintuitivo.
Dave X
Mi experiencia sugiere que la lógica, del tipo deductivo formal, es algo maravilloso pero genera intuiciones extremadamente malas sobre la inferencia probabilística. Las herramientas aquí bmj.com/content/343/bmj.d6386 pueden ayudar a su intuición.
conjugateprior
Según tengo entendido, la pregunta es pedir intuición acerca de cómo la probabilidad condicional puede ser tan baja dados los supuestos; no se trata de estadísticas reales de mamografías de la vida real (de las que parecen tratarse las respuestas).
Juho Kokkala
Creo que hay un error tipográfico en el denominador (el segundo término debe ser (.01 * 0.99). Sin embargo, el resultado es correcto. No es realmente una intuición, pero simplificando tienes P (C | +) = P (C) / (P (C) + (P (+ |! C) P (! C)) y P (C) es muy bajo. Por lo tanto, P (C | +) es extremadamente sensible a P (+ |! C), es decir, necesitaría P ( + |! C) << P (C) para que P (C | +) se acerque a 1
David Waterworth

Respuestas:

11

Contestaré esta pregunta tanto desde el punto de vista médico como estadístico. Ha recibido mucha atención en la prensa laica, particularmente después del éxito de ventas The Signal and the Noise de Nate Silver, así como una serie de artículos en publicaciones como The New York Times que explican el concepto. Así que estoy muy contento de que @ user2666425 haya abierto este tema en CV.

En primer lugar, déjenme aclarar que la no es exacto. Les puedo decir que esta cifra sería un sueño hecho realidad. Desafortunadamente, hay muchasmamografíasfalsas negativas, particularmente en mujeres con tejido mamario denso. La cifra estimada puede ser del 20 % o más, dependiendo de si agrupa todos los diferentes tipos de cáncer de seno en uno (invasivo v DCIS) y otros factores. Esta es la razón por la cual también se aplican otras modalidades basadas en tecnología sonográfica o de resonancia magnética. Una diferencia entre 0.8 y 1 es crítica en una prueba de detección.pag(+El |C)=120%0.81

El teorema de Bayes nos dice que , y recientemente ha recibido mucha atención en relación con la mamografíaen mujeres más jóvenes y de bajo riesgo. Me doy cuenta de que esto no es exactamente lo que está preguntando, que abordo en los párrafos finales, pero es el tema más debatido. Aquí hay una muestra de los problemas:pag(CEl |+)=pag(+El |C)pag(+)pag(C)

  1. La previa (o probabilidad de tener cáncer en función de la prevalencia) en pacientes más jóvenes , digamos de 40 a 50 años de edad, es bastante pequeña. Según el NCI , podría redondearlo a (consulte la tabla a continuación). Esta probabilidad relativamente baja previa a la prueba en sí misma reduce la probabilidad condicional posterior a la prueba de tener cáncer dado que la mamografía fue positiva, independientemente de la probabilidad o los datos recopilados.1,5%

  2. 7 7-10%1%

Entonces, recalculando y muy importante, para mujeres más jóvenes sin factores de riesgo :

pag(CEl |+)=pag(+El |C)pag(+)pag(C)=

=p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)p(C)=0.80.80.015+0.070.9850.015=0.148

15%

4045

En mujeres mayores, la prevalencia (y, por lo tanto, la probabilidad previa a la prueba) aumenta linealmente con la edad. Según el informe actual, el riesgo de que una mujer sea diagnosticada con cáncer de seno durante los próximos 10 años , a partir de las siguientes edades, es el siguiente:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

10%

4 4%

pag(CEl |+)=0.80.80,04+0,070,960,04=0,3232%

pag(CEl |+)

Respuesta específica a su pregunta:

pag(+El |C¯)7 7-10%1%pag(C¯)Tenga en cuenta que esta "tasa de falsas alarmas" se multiplica por la proporción mucho mayor de casos sin cáncer (en comparación con los pacientes con cáncer) en el denominador, no por la "pequeña probabilidad del 1% de un falso positivo en el 1% de la población" mencionar. Creo que esta es la respuesta a tu pregunta. Para enfatizar, aunque esto sería inaceptable en una prueba de diagnóstico, todavía vale la pena en un procedimiento de detección.

Problema de la intuición: @Juho Kokkala trajo a colación el problema que el OP estaba preguntando sobre la intuición . Pensé que estaba implícito en los cálculos y los párrafos finales, pero es justo ... Así es como se lo explicaría a un amigo ... Supongamos que vamos a buscar fragmentos de meteoritos con un detector de metales en Winslow, Arizona. Aquí mismo:

Imagen de meteorcrater.com

... y el detector de metales se apaga. Bueno, si dijiste que es probable que sea de una moneda que un turista dejó, probablemente tengas razón. Pero entiendes lo esencial: si el lugar no hubiera sido tan bien examinado, sería mucho más probable que un pitido del detector en un lugar como este viniera de un fragmento de meteorito que si estuviéramos en las calles de Nueva York.

Lo que estamos haciendo con la mamografía es ir a una población sana, en busca de una enfermedad silenciosa que, si no se detecta a tiempo, puede ser letal. Afortunadamente, la prevalencia (aunque muy alta en comparación con otros cánceres menos curables) es lo suficientemente baja como para que la probabilidad de encontrar cáncer al azar sea baja, incluso si los resultados son "positivos" , y especialmente en mujeres jóvenes.

pag(C¯El |+)=0 0

pag(+El |C)pag(+El |C)pag(C)+pag(+El |C¯)pag(C¯)pag(C)=pag(+El |C)pag(+El |C)pag(C)pag(C)=1100%

Como nunca tenemos un dispositivo o sistema de medición perfectamente preciso, la fracciónprobabilidadincondicional p (+)=pag(+El |C)pag(+El |C)pag(C)+pag(+El |C¯)pag(C¯)<1pag(C)posterior=αanteriorposterior<anteriorValor predictivo positivo (VPP) : probabilidad de que los sujetos con una prueba de detección positiva realmente tengan la enfermedad.

Antoni Parellada
fuente
5

Un problema clave con la mamografía que no se ha abordado adecuadamente en el discurso es la definición defectuosa de "positivo". Esto se describe en el capítulo Diagnóstico en http://biostat.mc.vanderbilt.edu/ClinStat : consulte el enlace de Bioestadística en Investigación Biomédica allí.

Uno de los sistemas de codificación de diagnóstico más utilizados en la mamografía es el puntaje BI-RADS, y un puntaje de 4 es un resultado "positivo" frecuente. La definición de la categoría 4 es "No es característica del cáncer de seno, pero tiene una probabilidad razonable de ser maligna (3 a 94%); se debe considerar la biopsia". Con un rango de riesgo que va desde 0.03 a 0.94 para una categoría , es decir, una increíble heterogeneidad en lo que realmente significa "positivo", no es de extrañar que tengamos un desastre en nuestras manos.

También es un signo de pensamiento poco claro de que el sistema BI-RADS no tiene categoría para alguien con un riesgo estimado de 0.945.

Como Nate Silver argumenta tan elocuentemente en The Signal and the Noise , si pensáramos probabilísticamente tomaríamos mejores decisiones en todos los sentidos. Eliminar términos como "positivo" y "negativo" para las pruebas médicas eliminaría los falsos positivos y los falsos negativos y transmitiría la incertidumbre (y la justificación para más pruebas antes de hacer un diagnóstico) de manera óptima.

Frank Harrell
fuente
Estábamos escribiendo en una sincronización práctica: consulte mis comentarios a continuación sobre BI-RADS. No podría estar más de acuerdo (toneladas de experiencia personal en esto como radiólogo).
Antoni Parellada
3

Hay una buena discusión sobre esto en el libro Riesgos calculados

Gran parte del libro trata de encontrar formas más claras de hablar y pensar acerca de la probabilidad y el riesgo. Un ejemplo:

La probabilidad de que una mujer de 40 años tenga cáncer de seno es aproximadamente del 1 por ciento. Si tiene cáncer de seno, la probabilidad de que dé positivo en una mamografía de detección es de alrededor del 90 por ciento. Si no tiene cáncer de seno, la probabilidad de que, sin embargo, dé positivo en el examen es del 9 por ciento. ¿Cuáles son las posibilidades de que una mujer que da positivo en realidad tenga cáncer de seno?

Esta es la forma en que el libro presenta la solución, usando 'frecuencias naturales'. Considere 10,000 mujeres, el 1% tiene cáncer, es decir 100 mujeres. De estos, el 90% arrojarán resultados positivos (es decir, 90 mujeres con cáncer darán positivo). De los 9900 sin cáncer, el 9% devolverá una prueba positiva o 891 mujeres. Entonces, hay 891 + 90 = 981 mujeres con pruebas positivas de las cuales 90 tienen cáncer. Entonces, la probabilidad de que una mujer con un resultado positivo tenga cáncer es 90/981 = 0.092

Si el 100% de las mujeres con cáncer dan positivo, eso solo cambia un poco los números a 100 / (100 + 891) = 0.1

Enfoque de frecuencia natural para comprender falsos positivos

Tony Ladson
fuente
1

¿Quizás esta línea de pensamiento es correcta ?:

.011

0.0025

usuario2666425
fuente
1

Aquí hay una forma simplificada pero intuitiva de verlo. Considera 100 personas. Uno tiene cáncer y dará positivo. De los 99 que no lo hacen, uno de ellos recibirá una prueba de falso positivo. Entonces, de los dos aspectos positivos, uno tendrá cáncer y el otro no.

Emil Friedman
fuente