¿Hay documentos / libros / ideas sobre la relación entre el número de características y el número de observaciones que uno necesita para formar un clasificador "robusto"?
Por ejemplo, suponga que tengo 1000 características y 10 observaciones de dos clases como conjunto de entrenamiento, y otras 10 observaciones como conjunto de prueba. Entreno un clasificador X y me da 90% de sensibilidad y 90% de especificidad en el conjunto de pruebas. Digamos que estoy contento con esta precisión y en base a eso puedo decir que es un buen clasificador. Por otro lado, he aproximado una función de 1000 variables usando solo 10 puntos, lo que puede parecer poco ... ¿robusto?
fuente