Entiendo cómo funciona la convolución, pero no entiendo cómo se aplican las convoluciones 1D a los datos 2D.
En este ejemplo, puede ver una convolución 2D en datos 2D. Pero, ¿cómo sería si hubiera una convolución 1D? ¿Solo un kernel 1D deslizándose de la misma manera? ¿Y si el paso era 2?
¡Gracias!
conv-neural-network
Gustavo
fuente
fuente
Respuestas:
Para una explicación un poco más matemática, puede consultar a Ji Young Lee, Franck Dernoncourt. " Clasificación secuencial de texto corto con redes neuronales recurrentes y convolucionales ". NAACL 2016 . sección 2.1.2:
fuente
Las convoluciones 1D se utilizan en redes convolucionales para muestreo descendente y muestreo ascendente en la dimensión del filtro. Las redes convolucionales construyen estos mapas de filtro a medida que avanza por la red, realmente puede pensar en ellos como una tercera dimensión. El caso base habitual de la dimensión del mapa de filtro es un tamaño de 3, ya que a menudo tendremos imágenes RGB que atraviesan nuestra red.
Estas convoluciones 1D pueden ser útiles para el muestreo descendente, realizar algunas operaciones y luego volver a muestrear a la misma dimensión. Esto es bastante útil por razones de rendimiento.
Para entender realmente intuitivamente, sugiero leer:
Red en red: http://arxiv.org/abs/1312.4400
Profundizando en las convoluciones: https://www.google.com/url?sa=t&source=web&rct=j&url=http://www.cs.unc.edu/~wliu/papers/GoogLeNet.pdf&ved=0ahUKEwi89oeuxqnLAhXhuIMKHZrTCe0QFggkAEugg rrECNQ72wI3PH1Qw & sig2 = VhjfaMvuskNIDVKhFfNiqQ
fuente