Si hubo un video original con una pista de audio y luego alguien le agregó música mezclándolo sobre el audio original, es imposible "des-mezclar" esas dos señales nuevamente. Su archivo tiene solo una pista de audio, por lo que no hay nada que separar.
PD: La única excepción son las señales en las que el diseño estéreo le permitiría extraer ciertos componentes. Un ejemplo típico es un "efecto de karaoke", en el que se extraen las voces de la música pop, ya que normalmente se mezclan en el punto muerto y se encuentran dentro de un rango de frecuencia conocido y, por lo tanto, son más fáciles de separar de otros instrumentos. Hay herramientas para esto que se venden comercialmente , pero también hay otras herramientas gratuitas . Y la perspectiva del ingeniero de sonido sobre esto se describe aquí .