¿Cuáles son los significados del segundo argumento de la convolución?

8

Intenté comprender mejor la convolución y sus propiedades e interpretaciones matemáticas en ingeniería (especialmente en el contexto de la visión por computadora). Recordemos la convolución:

s(t)=(xw)(t)=x(a)w(ta)da

el primer argumento (a la convolución) generalmente se denomina entrada, pero el segundo argumento (a la convolución) generalmente se denomina " núcleo ". Sin embargo, en la visión por computadora y las redes neuronales convolucionales, el segundo argumento generalmente se denomina " plantilla " (tal vez la imagen de un borde o una rueda, o alguna parte de un objeto). Sin embargo, en otras áreas, creo que se trata de señales y sistemas, generalmente se llama un " filtro ".xw

Como ingeniero informático, creo que nombrar es extremadamente importante porque nos da el poder de pensar sobre conceptos específicos. Tener malos nombres puede conducir a un pensamiento descuidado. Por lo tanto, estaba asumiendo que estos nombres técnicos probablemente fueron elegidos con estas ideas en mente. ¿Alguien sabe o entiende por qué estos nombres se han utilizado para el segundo argumento de la convolución?

Los nombres específicos que conozco son:

  1. Kernel (¿de pura matemática?)
  2. Filtro (señales y sistemas?)
  3. Plantilla (visión artificial / aprendizaje automático)

No estoy seguro de si me falta alguno, pero me gustaría entender mejor estos nombres y posiblemente (con suerte) entender intuitivamente mejor lo que hace el operador de convolución y su interpretación en ingeniería y matemáticas.

Charlie Parker
fuente

Respuestas:

6

Creo que el rango diverso de nombres para el segundo argumento surge del hecho de que la operación de convolución es muy útil en tantos campos diferentes.

Es útil recordar lo que hace la operación de convolución antes de abordar los términos específicos. Citando Wolfram Mathworld , "una convolución es una integral que expresa la superposición de una función medida que se desplaza sobre otra función ". Expresado de otra manera, la convolución es una forma matemática de verificar para ver cuánto de una función existe en otra función, ya que las dos se deslizan entre sí. Los ejemplos visuales de convolución de Wikipedia tienen buenas ilustraciones de cómo funciona. gf

  1. Kernel: este es el término más general, y surge de las matemáticas. En matemáticas, una transformación integral es una transformación general definida por La función en esta transformación integral se llama kernel. La operación de convolución es solo una subclase de esta transformación más general y, por lo tanto, la segunda función se llama correctamente el núcleo. Desafortunadamente, no sé el origen del término kernel en la transformación integral general.

    g(α)=abf(t)K(α,t)dt.
    K(α,t)
  2. Filtro: en el procesamiento de señales digitales, un filtro coincidente "se obtiene correlacionando una señal conocida o plantilla con una señal desconocida para detectar la presencia de la plantilla en la señal desconocida". En este sentido, la segunda función actúa como un filtro para la primera función, diciéndole qué partes de la primera tienen las propiedades de la segunda.

  3. Plantilla: Esta es la menos familiar para mí, pero creo que puedes ver cómo surge del mismo lugar que el término 'filtro'. La plantilla es una señal conocida a priori que está buscando en la señal desconocida. La convolución de los dos le dice qué partes de la señal desconocida tienen las mismas características que la plantilla.

Chris Mueller
fuente