Preguntas etiquetadas con dct

75

¿Cuál es la diferencia entre una transformada de Fourier y una transformada de coseno?

En el reconocimiento de voz, el front end generalmente procesa la señal para permitir la extracción de características del flujo de audio. Una transformada discreta de Fourier (DFT) se aplica dos veces en este proceso. La primera vez es después de la ventana; después de esto se aplica Mel binning y...

dct dft

15

Transformación rápida de coseno a través de FFT

Quiero implementar la transformación rápida de coseno. Leí en Wikipedia , que hay una versión rápida de DCT que se calcula de manera similar a la FFT. Traté de leer el documento citado de Makhoul *, para las implementaciones FTPACK y FFTW que también se usan en Scipy , pero no pude extraer el...

fft dct

13

¿Podría usarse una DCT para un espectro de magnitud de audio en lugar de DFT?

Por lo que entiendo, el DCT tiene la mitad del tamaño del depósito que un DFT del mismo tamaño N. El DFT también incluye información de fase, pero a menudo esto no es necesario cuando solo se desea el espectro de magnitud. ¿Se podría usar el DCT para proporcionar un espectro de magnitud con el...

dct dft

12

Relación entre DCT y PCA

Tengo un conocimiento básico de implementación del DCT 2D 8x8 utilizado en la compresión de imagen y video. Mientras leo sobre el Análisis de componentes principales, puedo ver mucha similitud, aunque PCA es claramente más genérico. Cuando leí sobre DCT anteriormente, siempre se presentó en...

image-processing discrete-signals dct video-compression

9

¿Es esta una interpretación correcta del paso DCT en el cálculo de MFCC?

Esta es una continuación de la discusión aquí . Yo comentaría allí, pero no tengo 50 repeticiones, así que estoy haciendo una nueva pregunta. Así es como entiendo el paso DCT en el proceso de cálculo de MFCC: la razón detrás de esto es separar la correlación en las magnitudes logarítmicas...

mfcc dct

8

DCT y umbral duro

Si tengo una imagen y encuentro el DCT y luego aplico un umbral duro en los coeficientes y luego IDCT, entonces he atenuado el ruido. ¿Puede alguien explicarme en detalle o señalarme la respuesta de por qué esto funciona? Entiendo por qué un filtro que bloquea la alta frecuencia funcionará en la...

image-processing dct thresholding sparse-model

7

JPEG esteganografía

Además de Jsteg de Derek Upham, Outguess of Neils Provos y F5 (mejora de F3 y F4) de Pfitzmann y Westfeld, ¿qué otros métodos puede usar para ocultar información en imágenes JPEG? Los métodos que mencioné anteriormente ocultan el mensaje en los coeficientes DCT de la imagen antes de que se...

image-processing dct jpeg

7

Implementación rápida de DCT

Tengo problemas para descubrir cómo seguir los rápidos diagramas del algoritmo DCT 8x8 que se encuentran en los siguientes dos documentos: (1) Un algoritmo computacional rápido para la transformación discreta del coseno por Chen et al. y (2) Algoritmos prácticos rápidos de DCT 1-D con 11...

dct