Gracias por la referencia! Olvidó mencionar su trabajo en la mejora de la batería , que también puede ser de interés para la aplicación Summer_More_More_Tea. Bueno, todo eso realmente depende de lo que quieras hacer con él. ¿Tiene en mente una "aplicación final" específica?
Estoy completamente de acuerdo con las declaraciones anteriores de pichenettes. Sin embargo, para completar, debo decir que la mejora vocal que mencionaste también ha sido utilizada en algunos trabajos de Matti Ryynänen, en la generación de pistas de Karaoke, para mejorar los resultados.
Para responder tu pregunta:
Dada la efectividad, ¿cuál es la preferida (o cualquier otra solución :)?
Como dijo Pichenettes, ninguno parece satisfacer su necesidad: el filtrado de paso bajo / paso alto está destinado a fallar debido a la estructura armónica de la voz humana (y más generalmente a cualquier sonido "interesante", es decir, cualquier cosa más allá de las sinusoides ... )
Si el segundo, deje dos canales A y B, ¿se utilizará (BA) o (AB) al calcular el fondo? Al igual que con la fusión de dos canales, ¿significa la aritmética lo suficientemente precisa?
Nuevamente, el segundo método que mencionas no funcionará porque solo puedes eliminar la señal que está en el centro, no recuperarla. En otras palabras, incluso las voces están en el "centro", no hay matemáticas simples para obtener una señal de solo voces.
¿O puedo reducir la muestra de cada canal por un factor de dos e intercalar las señales disminuidas como resultado mono?
er ... promediar los canales para obtener una señal monocanal, como se sugirió anteriormente, tiene sentido y no romperá las características espectrales de su señal (suponiendo que la señal estéreo no esté degenerada). Entonces obtienes una señal mono en la que tienes, básicamente, el mismo contenido musical que antes.
El muestreo correcto de cada canal significa que primero aplica un filtro de paso bajo (con una frecuencia de corte de sample_rate / 4 en su caso), y luego puede tomar de manera segura cada 2 muestras. Sin embargo, no hay mucho que decir acerca de la intercalación de los canales, por lo tanto, disminuyeron: en la mayoría de los casos generales, esto está rompiendo las características espectrales de su señal. Probablemente no quieras eso.
De hecho, la operación de filtrado de paso bajo seguido de establecer a 0 cada 2 muestras, y mantener estos cables de 0, en el dominio de Fourier, para "reflejar" los componentes de baja frecuencia que se mantuvieron en los de alta frecuencia. Recuerde que las lecciones de procesamiento de señales en la teoría de muestreo: multiplicar por una secuencia de impulsos (o diracs) da como resultado una convolución con otra secuencia de diracs en el dominio de Fourier, es decir, en ese caso, el espectro de frecuencia de la señal se repite (periodizado) a lo largo del eje de frecuencia, con un período igual a la frecuencia de muestreo.
Normalmente, al reducir la muestra, elimina los 0 (porque supone una nueva frecuencia de muestreo). Pero aquí, mantenerlos da como resultado componentes de alta frecuencia adicionales muy molestos. Intercalar estas señales no va a corregir esto.
Bueno, en general, la respuesta corta: no hagas eso . :-)
Por último, también podría sugerirle que use la GUI que desarrollé para la conferencia LVAICA 2012: hay un repositorio git para ello. Todavía lo estoy depurando y mejorando, así que los comentarios son bienvenidos: D
¡Espero que ayude!