¿Por qué el uso poco frecuente de las técnicas de aprendizaje automático en la biomedicina traslacional?

8

Esto es en seguimiento a una pregunta anterior. aquí :

Modelo de red neuronal para predecir el resultado del tratamiento

y podría considerarse que se refiere a un aspecto diferente de esta pregunta:

Aplicación de técnicas de aprendizaje automático en estudios clínicos de muestras pequeñas.

Gracias a Zach que sugirió volver a publicar.

He puesto algunas lecturas bastante serias en CART, randomForest, Neural Networks y machine learning en general, aprendí sobre WEKA y los paquetes R, vi y seguí las conferencias de ingeniería de Stanford http://www.ml-class.org/ curso / clase / índiceTengo 3 capítulos en Hastie. Dado el tipo de datos que vemos regularmente en la investigación orientada clínicamente: un montón de parámetros clínicos + un montón de parámetros bioquímicos + datos de prueba con lápiz y papel +/- datos de neuroimagen con números pequeños, tengo la sensación de que me falta algo. No leo regularmente sobre las técnicas de ML que se aplican en la literatura de investigación. Mi pregunta es: ¿acabo de aferrarme a algo que es dudoso y, por lo tanto, mirado con sospecha justificada al investigar a clínicos y bioestadísticos que lo conocen bien, o estas técnicas son realmente pasadas por alto o temidas fuera de la "analítica empresarial"? ¿Qué lo mantiene "nicho"?

rosser
fuente
Creo que el problema aquí está más relacionado con las revistas que lees que con cualquier otra cosa. El aprendizaje automático se aplica bastante en la medicina traslacional moderna, siempre que los modelos de caja negra sean aceptables para la tarea.
Marc Claesen

Respuestas:

8

Las técnicas de aprendizaje automático a menudo carecen de interpretabilidad. Además, tienden a ser bastante toscos desde un punto de vista estadístico, por ejemplo, las redes neuronales no hacen suposiciones sobre los datos de entrada. Tengo la sensación de que mucha gente (especialmente si tienen una sólida base estadística) los menosprecia.

bayerj
fuente
Sí, creo que tengo eso. Sin embargo, desde mi punto de vista, los métodos estadísticos no son puros ni sucios, solo la aplicación de la lógica a los datos. Si desea una píldora para curar algo, debe comprender las interrelaciones y llevarla al laboratorio de biología molecular. Sin embargo, si solo desea hacer una predicción utilizando métodos de caja negra (NN / RF) o de decisión (CART), ¿cuál es el problema? Incluso podría obtener una idea. ¿Es más profundo que el esnobismo?
rosser
Si bien la interpretabilidad es ciertamente agradable, no estoy seguro de si consultaría a un médico que sabe lo que está haciendo y tiene una tasa de éxito del 60% frente a un médico que no tiene idea pero tiene una tasa de éxito del 100%;)
blubb
1
Es posible que le interese el 'Modelo estadístico de Leo Breiman: las dos culturas', donde se cubre en profundidad ( Recognition.su/wiki/images/8/85/Breiman01stat-ml.pdf ) Además, hay razones para este enfoque: - si quieres que los humanos interpreten cosas, por ejemplo.
bayerj 05 de
@blubb, consultaría a un médico que no tiene ni idea pero tiene una tasa de éxito del 100% con un intervalo de confianza [98,100] :)
Simone
4

El historial de aprendizaje automático en biomedicina no ha sido muy bueno. Los primeros éxitos en el aprendizaje automático llegaron en áreas de reconocimiento de patrones de alta relación señal: ruido, como el reconocimiento visual de patrones. La relación S: N es mucho más baja en biología y ciencias sociales. El aprendizaje automático se adapta de manera efectiva a muchas interacciones entre predictores, y para hacerlo debe tener un gran tamaño de muestra o una relación S: N muy alta. Ver ¿La medicina es hipnotizada por el aprendizaje automático? . Además, muchos profesionales del aprendizaje automático han entendido mal las tareas de predicción como tareas de clasificación. Mira aquí para más.

Frank Harrell
fuente