Para valores complejos, ¿por qué usar conjugado complejo en convolución?

8

Tomado de Adaptive Filter Theory (2014) escrito por Haykin página 110:

y(n)=k=0wku(nk),n=0,1,2,...

dónde u y wSon valores complejos. Mi pregunta es por qué usar conjugado complejo dewk? La respuesta encontrada en el libro dice "..., en terminología compleja, el términowku(nk)representa la versión escalar de un producto interno del coeficiente de filtrowk y la entrada del filtro u(nk)" . Todavía no entiendo, ¿puedes dar más detalles sobre esta respuesta?

Ηλεκτρολόγος Μηχανικός
fuente

Respuestas:

10

Resulta que la convolución y la correlación están estrechamente relacionadas. Para señales reales (y señales de energía finita):

Circunvolución: y[n]h[n]x[n]=m=h[nm]x[m]

Correlación: Ryx[n]m=y[n+m]x[m]=y[n]x[m]

Ahora, en espacios métricos, nos gusta usar esta notación:

Rxy[n]x[m],y[n+m]=m=x[m]y[n+m]

los x,yes el producto interno de los vectoresx y y dónde x={x[n]} y y={y[n]}. Entonces también nos gusta definir la norma de un vector como

xx,x=m=x[m]x[m]=m=x2[m]

y eso se parece mucho a la longitud euclidiana de un vector con un número infinito de dimensiones. Todo esto funciona muy bien para el caso donde los elementosx[n] del vector xson todos reales La normax siempre es real y no negativo.

Entonces, si generalizamos y permitimos los elementos de x tener un valor complejo, entonces si se va a utilizar la misma definición de norma,

xx,x

entonces la definición del producto interno debe modificarse un poco:

x,y=m=x[m]y[m]

Entonces sí x tiene elementos de valor complejo, la norma sale como:

xx,x=m=x[m]x[m]=m=|x[m]|2

Entonces, evidentemente, Haykin simplemente está volviendo esa definición de producto interno a la definición de convolución.

robert bristow-johnson
fuente
4

El uso del conjugado en la formación del filtro adaptativo no es necesario. Sin embargo, si no escribe la salida utilizando un conjugado, es bastante fácil olvidar que las variables con las que está tratando son complejas. Si tú escribes

h(n)=k=0wk(n)u(nk)
entonces no está claro que se trata de cantidades complejas.

Como Robert ya ha señalado, la definición de correlación debe actualizarse para manejar datos complejos si está acostumbrado a verlos definidos solo para datos reales.

Otra razón para usar el conjugado de esta manera es simplificar la toma de derivados para encontrar la solución al filtro adaptativo. Supongamos que tenemos una función objetivo de valor realJ(w) que estamos tratando de minimizar, generalmente este es el error cuadrático medio, es decir E[e(n)e(n)]. Tomando la derivada de esta cantidad wrtw No es tan sencillo.

La técnica común es escribir la función objetivo en función de w y w es decir, tratar w y wcomo variables independientes Ahora tenemos

J(w)=F(w,w)

Para encontrar el mínimo tomamos los derivados wrt w y w y ponerlos a cero, así que queremos resolver

F(w,w)w=F(w,w)w=0

Sin embargo, si haces el análisis, encontrarás que

F(w,w)w=0F(w,w)w=0

Para que solo necesites resolver una de estas ecuaciones.

Para obtener detalles completos, puede consultar:

  • "Un operador de gradiente complejo y su aplicación en la teoría de matrices adaptativas", Brandwood 1983, Comunicaciones, Radar y procesamiento de señales, IEE Proceedings F
  • "El operador gradiente complejo y el cálculo CR" Kreutz-Delgado aquí
  • "Gradiente complejo y arpillera", van den Bos, 1994, Visión, Procesamiento de imagen y señal, Actas de la EEI

Para la teoría de los filtros adaptativos, prefiero la presentación en "Fundamentos del filtrado adaptativo" de Ali Sayed. Presenta una derivación unificada de los filtros LMS, NLMS, RLS, APA y Lattice.

David
fuente