Sé que no hay una respuesta clara para esta pregunta, pero supongamos que tengo una gran red neuronal, con muchos datos y quiero agregar una nueva característica en la entrada. La "mejor" forma sería probar la red con la nueva función y ver los resultados, pero ¿existe algún método para probar si la función NO ES ÚTIL? ¿Como medidas de correlación ( http://www3.nd.edu/~mclark19/learn/CorrelationComparison.pdf ), etc.?
16
Respuestas:
Una correlación muy fuerte entre la nueva característica y una característica existente es una señal bastante buena de que la nueva característica proporciona poca información nueva. Es probable que sea preferible una baja correlación entre la nueva característica y las características existentes.
Una fuerte correlación lineal entre la nueva característica y la variable predicha es una buena señal de que una nueva característica será valiosa, pero la ausencia de una alta correlación no es necesariamente una señal de una característica pobre, porque las redes neuronales no están restringidas a combinaciones lineales. de variables.
Si la nueva característica se creó manualmente a partir de una combinación de características existentes, considere dejarla fuera. La belleza de las redes neuronales es que se requiere poca ingeniería de características y preprocesamiento: las capas intermedias aprenden las características. Siempre que sea posible, prefiera las funciones de aprendizaje a diseñarlas.
fuente
Si está utilizando sklearn, hay una buena función disponible llamada model.feature_importances_. Pruébelo con su modelo / nueva característica y vea si ayuda. También mira aquí y aquí para ver ejemplos.
fuente