Me encontré con un rumor de que algunos estudios mostraron que el rendimiento de los modelos predictivos depende más de la experiencia del analista de datos con el método elegido que de la elección del método.
En otras palabras, la afirmación es que es más importante que el analista de datos esté familiarizado con el método elegido que cuán "apropiado" parecería el método para el problema desde un punto de vista más teórico.
Esto se mencionó en el contexto de la quimiometría, que generalmente involucra problemas de muchas variantes (100s - 1000s), colinealidad múltiple y, por supuesto, muy pocas muestras. La predicción puede haber sido clasificación o regresión.
Mi experiencia personal sugiere que esto es plausible , pero se mencionó un estudio (le pregunté a la persona que lo mencionó por correo electrónico después de una búsqueda rápida pero fallida, pero nunca recibí ninguna respuesta). Sin embargo, también con una búsqueda más elaborada, no pude localizar ningún documento.
¿Alguien está al tanto de tales hallazgos? Si no, ¿qué dice la experiencia personal de Big Guys aquí?
fuente
Respuestas:
En realidad, escuché el rumor de que las máquinas de aprendizaje decentes suelen ser mejores que los expertos, porque la inclinación humana es minimizar la variación a expensas del sesgo (exceso de suavidad), lo que conduce a un pobre rendimiento predictivo en un nuevo conjunto de datos. La máquina está calibrada para minimizar el MSE y, por lo tanto, tiende a funcionar mejor en términos de predicción en un nuevo conjunto de datos .
fuente