¿Alguien tiene una referencia que describa el algoritmo MP3 de manera paso a paso y claro para entender?
Estas referencias fueron un poco confusas:
- Compresión de audio usando la transformación de coseno discreta modificada, The MP3 Coding Standard , Joebert S. Jacaba, 2001
- The Theory Behind Mp3 , Rassol Raissi, 2002
Estoy dispuesto a codificar un flujo de bits a MP3 después de leer la referencia que introduce, manualmente, para una comprensión completa del procedimiento.
algorithms
reference-request
compression
mp3
Laurent Duval
fuente
fuente
Respuestas:
Un estándar de compresión es algo bastante delicado, que tardó años en desarrollarse y ajustarse. Sugiero el análisis del algoritmo MPEG-1 Layer III (MP3) usando MATLAB , 2012 por Jayaraman J. Thiagarajan y Andreas Spanias. Después de una descripción general, lo lleva paso a paso a través de los diferentes bloques de todo el esquema, proporcionando un código de Matlab para cada uno de ellos.
fuente
Los documentos que encontraste me parecen referencias bastante buenas, los he leído brevemente y seguramente querré estudiarlos a fondo, +1 por eso. Pero su pregunta no parece tener mucho sentido, o al menos no tiene una respuesta viable.
El procedimiento es extremadamente complejo (como se dio cuenta al leer los documentos) y se basa en múltiples capas de cálculo básico, transformadas de Fourier, ingeniería de audio, procesamiento de señales, etc. No puede comprender el procedimiento sin comprender el teoría.
Tampoco es humanamente posible, en términos prácticos, codificar manualmente un archivo de audio a mano. Tiene que hacer literalmente miles (probablemente cientos de miles, para una implementación completa de MP3) de operaciones aritméticas complejas solo para codificar un solo cuadro de audio de, digamos, 512 muestras. Eso es solo alrededor de 0.01 segundos de música a una frecuencia de muestreo de 44.1KHz.
¿Quizás deberías enfocar tus esfuerzos de aprendizaje en cosas menos avanzadas para empezar?
fuente