Prueba estadística de valor predictivo positivo y negativo.

Suponiendo una clasificación cruzada como la que se muestra a continuación (aquí, para un instrumento de detección)

texto alternativo

Podemos definir cuatro medidas de precisión de detección y poder predictivo:

Sensibilidad (se), a / (a + c), es decir, la probabilidad de que la pantalla proporcione un resultado positivo dado que la enfermedad está presente;
Especificidad (sp), d / (b + d), es decir, la probabilidad de que la pantalla proporcione un resultado negativo dado que la enfermedad está ausente;
Valor predictivo positivo (VPP), a / (a + b), es decir, la probabilidad de que los pacientes con resultados positivos de la prueba sean diagnosticados correctamente (como positivos);
Valor predictivo negativo (VPN), d / (c + d), es decir, la probabilidad de que los pacientes con resultados negativos de la prueba sean diagnosticados correctamente (como negativos).

Cada cuatro medidas son proporciones simples calculadas a partir de los datos observados. Por lo tanto, una prueba estadística adecuada sería una prueba binomial (exacta) , que debería estar disponible en la mayoría de los paquetes estadísticos, o en muchas calculadoras en línea. La hipótesis probada es si las proporciones observadas difieren significativamente de 0.5 o no. Sin embargo, me pareció más interesante proporcionar intervalos de confianza en lugar de una sola prueba de significación, ya que proporciona información sobre la precisión de la medición. De todos modos, para reproducir los resultados que mostró, necesita conocer los márgenes totales de su tabla de dos vías (solo proporcionó el PPV y NPV como%).

Como ejemplo, supongamos que observamos los siguientes datos (el cuestionario CAGE es un cuestionario de detección de alcohol):

texto alternativo

entonces en R el PPV se calcularía de la siguiente manera:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831

Si está utilizando SAS, puede consultar la Nota de uso 24170: ¿Cómo puedo estimar la sensibilidad, la especificidad, los valores predictivos positivos y negativos, las probabilidades de falsos positivos y negativos y las razones de probabilidad? .

$p \pm 1.96 \times \sqrt{p(1-p)/n}$ $p=0.975$ $1-\alpha/2$ $\alpha=5$

Para mayor referencia, puede mirar

Newcombe, RG. Intervalos de confianza de dos lados para la proporción única: comparación de siete métodos . Estadísticas en medicina , 17, 857-872 (1998).

chl
fuente

Gracias. Ok, leí al principio del artículo que usaban la prueba de Chi-cuadrado para todas las variables categóricas. La tabla de clasificación escrita no se refiere a una variable en particular, es el resultado de una tarea de clasificación. ¡No está muy claro! Ahora supongo que hicieron una prueba clásica en proporción .. tal vez Chi-cuadrado ..

Simone

Eché un vistazo a esta pregunta nuevamente y he visto que el valor p no se refiere ni a PPV ni a NPV, sino que se refiere a toda la fila. Creo que la prueba que tuvieron debería estar asociada a toda la tabla de contingencia.

Simone

@Simone Entonces, si te entiendo correctamente, ¿sugieres que los autores proporcionen valores de PPV y NPV pero dieron el valor p correspondiente a una prueba de asociación global de la tabla 2x2? ¿Está relacionado con esta pregunta reciente, stats.stackexchange.com/questions/9464/… ?

chl

Sí, estaría relacionado con esa pregunta si el valor p estuviera asociado ya sea al VPP o al VPN. Y en ese caso le diste la solución. La prueba corresponde a toda la tabla 2x2, ¡nunca sabré qué tipo de prueba es!

Simone

Prueba estadística de valor predictivo positivo y negativo.

Respuestas: