¿La clasificación basada en redes neuronales necesita una reducción de dimensiones?

9

Estoy usando un clasificador basado en redes neuronales para ejecutar una clasificación para mis datos en n-dimensional.

Entonces pensé que podría ser una buena idea ejecutar la reducción de dimensiones como PCA para mis datos al principio, y luego poner los resultados de PCA en el clasificador (conservo 3 PC). Sin embargo, la clasificación en las características de dimensión reducida no es tan buena como usar directamente las características de alta dimensión originales.

Luego me encontré con esta publicación NN como DR1 que analizaba las redes neuronales como un método de reducción de dimensiones. También se puede encontrar información en este documento NN como DR2. Ahora estoy confundiendo:

  1. Si uso la clasificación basada en redes neuronales (en Matlab), ¿hace la reducción de dimensión automáticamente?
  2. ¿Debo ejecutar la reducción de dimensiones como PCA antes de ejecutar la clasificación de redes neuronales?
  3. ¿Hay alguna otra razón por la cual la clasificación en los resultados de PCA no es tan buena como el uso de las características de alta dimensión originales?
Samo Jerom
fuente

Respuestas:

18

En principio, la transformación lineal realizada por PCA se puede realizar de la misma manera por los pesos de la capa de entrada de la red neuronal, por lo que no es estrictamente necesario. Sin embargo, a medida que aumenta el número de pesos en la red, la cantidad de datos necesarios para poder determinar de manera confiable los pesos de la red también aumenta (a menudo con bastante rapidez), y el sobreajuste se convierte en un problema (usar la regularización también una buena idea). El beneficio de la reducción de dimensionalidad es que reduce el tamaño de la red y, por lo tanto, la cantidad de datos necesarios para entrenarla. La desventaja de usar PCA es que la información discriminativa que distingue a una clase de otra podría estar en los componentes de baja variación, por lo que usar PCA puede empeorar el rendimiento.

Como la mayoría de las cosas en el reconocimiento de patrones estadísticos, no existe una receta única que funcione de manera confiable para todos los problemas, y realmente lo mejor es probar ambos enfoques y ver cuál funciona mejor.

Dikran Marsupial
fuente
1

Si uso la clasificación basada en redes neuronales (en Matlab), ¿hace la reducción de dimensión automáticamente? Respuesta: si está utilizando más de una capa para la clasificación y el número de neuronas en la capa oculta es menor que las neuronas de entrada, entonces tiene una especie de red neuronal de reducción dimensional. si en la imagen n> m tienes una red de reducción de dimensiones pero podría no ser una PCA.

mohammad amiri
fuente
0

Debido a que la red neuronal puede aproximarse a cualquier mapeo no lineal a través del aprendizaje y está libre de las restricciones de un modelo no lineal, no había necesidad de reducir la dimensión como PCA por adelantado. Esto también muestra que la red neuronal artificial (ANN) tiene un fuerte poder de cómputo no lineal.

ywj_huang
fuente