¿Cuál es la diferencia entre un campo receptivo y un mapa de características?

9

En una CNN, el campo receptivo es la porción de la imagen utilizada para calcular la salida del filtro. Pero la salida de un filtro (que también se llama "mapa de características") es la entrada del siguiente filtro.

¿Cuál es la diferencia entre un campo receptivo y un mapa de características?

Monica Heddneck
fuente

Respuestas:

4

Campo receptivo

El campo receptivo , en el contexto de la mecánica de CNN, es el rango discreto de entrada seleccionada como entrada al núcleo de convolución de una capa específica. El rango de un campo receptivo es una función de posición y tamaño. El rango se aplica a una o más dimensiones. 1

  • Horizontal
  • Vertical
  • Índice de cuadros
  • Incremento de tiempo
  • Índice de capa de píxeles
  • Otras dimensiones

La posición del campo receptivo se varía sistemáticamente para seleccionar un subconjunto del rango de índices en cada dimensión para cubrir el rango completo. 2 El tamaño coincide con la entrada del núcleo que opera sobre él y, por lo tanto, normalmente es constante. 3

Estas son las tres características definitorias de los campos receptivos en las CNN.

  • Especifica el rango de índices seleccionados para la entrada en el núcleo de convolución en términos de posición y tamaño del índice
  • El tamaño del rango de índice en cada dimensión (generalmente impar y menos de 20) coincide con las características de tamaño de entrada del núcleo
  • La posición del rango de índice en cada dimensión, variaba sistemáticamente para cubrir el rango completo de información en todas las dimensiones, generalmente variaba en incrementos fijos

Tenga en cuenta que el término campo receptivo se origina en los límites de la representación de la señal del campo visual capturado en los sistemas biológicos. En este contexto, el término campo receptivo se refiere al rango geométrico adquirido a través de dispositivos u órganos de imágenes. Así como un ojo puede escanear un paisaje, la selección de una posición dentro del campo de información total ocurre en el diseño de CNN.

Lo común entre lo biológico y lo artificial es el uso de variar el foco de atención sobre el espacio sensorial total.

Mapa de características como una representación de características extraídas

El término Mapa de características en este contexto es un mapa que representa las características extraídas a través de una o más capas de convolución. El término puede usarse incorrectamente para la salida intermedia de los núcleos, pero tenga en cuenta que la salida de las capas intermedias anteriores a las capas agrupadas aún no representan directamente las características. En esas etapas, la extracción es incompleta, por lo que no existe una relación directa entre valores y características.

El término mapa de características se usa con mayor precisión cuando se describe la salida de la última capa de agrupación en una sección de capas CNN. Esta sección puede estar dentro de una secuencia de secciones CNN o puede ser componentes en una arquitectura de sistema más grande.

Los ejemplos de asignaciones de características incluyen estos.

  • Bordes
  • Apariencia o desaparición (dominio temporal)
  • Elementos del objeto
  • Trayectoria de movimiento
  • Enfocar
  • Objetos
  • Comportamiento

En este uso del término, el mapeo de características es relativo a las dimensiones de la información, el espacio posicional sobre el cual se aplicó el núcleo.

Mapa de características como una representación de una transformación en el espacio discreto de Hilbert

Cuando el término Mapa de funciones se aplica a la asignación realizada por una o un conjunto de capas CNN, las funciones en la salida se asignan a la entrada, no a las posiciones. En este contexto, el mapeo es la transformación del tensor en Hilbert Space. Observe que el mapa no es una representación de la señal, sino la representación de la transformación, el núcleo y sus parámetros aprendidos en su estado actual.

Para desambiguar este contexto del anterior, puede ser útil usar el término Asignación de características para indicar una transformación de tensor en lugar de la salida de dicha transformación.

Superposición de los términos

Cuando la salida de una sección de convolución contiene un mapa de características y se alimenta a otra capa o sección de convolución, el mapa de características de una sección se convierte en el espacio completo sobre el cual el campo receptivo selecciona el subconjunto de información para alimentar al siguiente núcleo como entrada.

Tenga en cuenta que un mapa de características es una señal completa que representa todos los datos en su sección de la red, donde como campo receptivo suele ser un subconjunto de la señal completa aplicada varias veces para cubrir la amplitud de la señal completa en múltiples dimensiones.

Los dos términos no son sinónimos en ningún contexto, sino simplemente relacionados por teoría y práctica.

Notas al pie

[1] Tanto la posición como el tamaño se especifican en cada una de las dimensiones en , donde .norteyonortenorte1

[2] La selección de rangos dentro de cada dimensión puede lograrse mediante el bucle en algoritmos o mediante soluciones de hardware que realizan operaciones de ventanas con circuitos DSP o GPU, posiblemente realizadas mediante operaciones RISC paralelas controladas por hardware o firmware.

[3] Los índices de ejemplo y de época pueden estar delimitados de manera similar en algunos diseños de CNN, pero tales índices, en el sentido habitual del término, no se consideran parte de los campos receptivos. Solo las dimensiones dentro de cada ejemplo son. Además, los índices de flujo de entrada, como el identificador de cámara, generalmente no se incluyen como una dimensión dentro de un campo receptivo.

Douglas Daseeco
fuente
3

Espero que esta ilustración te ayude:

Campo (s) receptivo (s) : es una pequeña porción de la entrada para producir solo un nodo en un mapa de características .

Mapa (s) de características : es una salida de proceso convolucional, un mapa de características se puede decir como una representación de características de la entrada del filtro. Un mapa de características consta de muchas salidas de filtro (de diferentes campos receptivos) de un núcleo. El número de mapas de características depende del número del núcleo.

Entonces, incluso los mapas de características son la entrada del siguiente filtro, pero los siguientes campos receptivos no son un mapa de características. El siguiente campo receptivo consiste en un nodo de porción pequeña de diferentes mapas de características (no solo un mapa de características).

Y también, podemos ver en la ilustración anterior, un mapa de características tiene un tamaño bidimensional , luego un tamaño de campo receptivo siempre será tridimensional .(46×46)(5 5×5 5×Número de mapas de funciones)

malioboro
fuente