¿Tiene sentido entrenar a una CNN como autoencoder?

9

Trabajo analizando datos de EEG, que eventualmente necesitarán ser clasificados. Sin embargo, obtener etiquetas para las grabaciones es algo costoso, lo que me ha llevado a considerar enfoques no supervisados ​​para utilizar mejor nuestras cantidades bastante grandes de datos sin etiquetar.

Esto naturalmente lleva a considerar autoencoders apilados, lo que puede ser una buena idea. Sin embargo, también tendría sentido utilizar redes neuronales convolucionales, ya que algún tipo de filtrado es generalmente un enfoque muy útil para el EEG, y es probable que las épocas consideradas se analicen localmente y no como un todo.

¿Hay una buena manera de combinar los dos enfoques? Parece que cuando las personas usan CNN generalmente usan entrenamiento supervisado, ¿o qué? Los dos beneficios principales de explorar redes neuronales para mi problema parecen ser el aspecto no supervisado y el ajuste fino (sería interesante crear una red sobre datos de población y luego ajustar para un individuo, por ejemplo).

Entonces, ¿alguien sabe si podría pre-entrenar una CNN como si fuera un autoencoder "lisiado", o eso sería inútil?

¿Debería considerar alguna otra arquitectura, como una red de creencias profundas, por ejemplo?

Kaare
fuente

Respuestas:

8

Sí, tiene sentido usar CNN con codificadores automáticos u otros métodos no supervisados. De hecho, se han probado diferentes formas de combinar CNN con capacitación no supervisada para los datos de EEG, incluido el uso de codificadores automáticos (convolucionales y / o apilados).

Ejemplos:

Deep Feature Learning for EEG Recordings utiliza autoencoders convolucionales con restricciones personalizadas para mejorar la generalización entre sujetos y ensayos.

La predicción basada en EEG del rendimiento cognitivo del conductor mediante una red neuronal convolucional profunda utiliza redes de creencias profundas convolucionales en electrodos individuales y las combina con capas completamente conectadas.

Un novedoso enfoque de aprendizaje profundo para la clasificación de señales de imágenes motoras EEG utiliza autoencoders apilados totalmente conectados en la salida de una CNN supervisadamente entrenada (bastante superficial).

Pero también las CNN puramente supervisadas han tenido éxito en los datos de EEG, ver por ejemplo:

EEGNet: una red convolucional compacta para interfaces cerebro-computadora basadas en EEG

Aprendizaje profundo con redes neuronales convolucionales para el mapeo cerebral y la decodificación de información relacionada con el movimiento del EEG humano (divulgación: soy el primer autor de este trabajo, más trabajo relacionado ver pág. 44)

Tenga en cuenta que el documento de EEGNet muestra que también con un número menor de ensayos, el entrenamiento puramente supervisado de su CNN puede superar a sus líneas de base (ver Figura 3). También en nuestra experiencia en un conjunto de datos con solo 288 ensayos de capacitación, los CNN puramente supervisados ​​funcionan bien, superando ligeramente a los valores de referencia de los patrones espaciales comunes comunes del banco de filtros tradicional.

robintibor
fuente