Tenemos un biomarcador potencial para predecir si un paciente tiene cáncer o no. El resultado de la prueba de biomarcadores es binario positivo o negativo. Queremos tener una idea de la cantidad de pacientes que necesitan ser evaluados para determinar si este biomarcador es un buen predictor o no.
Al leer en Internet, parece que el camino a seguir es observar la sensibilidad (para el número de casos) y la especificidad (para el número de controles). Se sugiere que trate esta situación como una prueba de proporción de una muestra, pero no está claro cómo debe estimar cuál es la sensibilidad y el rango para el que está preparado, excepto. Si digo que considero que cualquier biomarcador con una sensibilidad superior a 0,8 es "bueno", ¿cómo establecería las dos variables? Me gustaría que mi hipótesis nula sea que el biomarcador no es mejor que una asignación aleatoria, es decir, una sensibilidad de 0.5. ¿Alguien podría dar un ejemplo de la mejor manera de hacer esto (especialmente si está en R).
Respuestas:
Hablemos de sensibilidad (que denotaremos por ), la especificidad es similar. El siguiente es un enfoque frecuentista; Sería genial si uno de los bayesianos aquí pudiera agregar otra respuesta para discutir una forma alternativa de hacerlo.pag
Supongamos que ha reclutado personas con cáncer. Aplica su prueba de biomarcadores a cada uno, por lo que obtendrá una secuencia de 0 y 1 que llamaremos . Las entradas de tendrán una distribución de Bernoulli con probabilidad de éxito . La estimación de es . Con suerte, es "grande", y puede juzgar la precisión de su estimación a través de un intervalo de confianza para .norte pag pag pag^= ∑ x / n pag^ pag
x
x
Su pregunta dice que le gustaría saber qué tan grande debería ser . Para responderla, deberá consultar la literatura de biomarcadores para decidir qué tan grande es "grande" y qué tan baja sensibilidad puede tolerar debido a un error de muestreo. Suponga que decide que un biomarcador es "bueno" si su sensibilidad es mayor que (eso en realidad no es tan bueno), y desea que sea lo suficientemente grande para que haya un 90% de posibilidades de detectar una sensibilidad de . Supongamos que desea controlar su nivel de significancia en .norte p = 0.5 norte p = 0,57 α=0.05
Existen al menos dos enfoques: analítico y de simulación. El
pwr
paqueteR
ya existe para ayudar con este diseño; primero debe instalarlo. A continuación, necesitará un tamaño de efecto, luego la función que desea espwr.p.test
.Una vez que tenga sus datos, la forma de ejecutar la prueba es (simularé los datos en aras de la discusión).
EDITAR: Si te gusta más el enfoque de simulación, entonces puedes hacerlo de esta manera: establecer
y dejar
runTest
serentonces la estimación del poder es
fuente