¿Cuál es la matemática detrás de la propiedad de reducción de ruido del filtro mediano?
8
Estoy interesado en comprender la razón matemática de por qué la aplicación de un filtro mediano en una imagen (o señal) da como resultado una reducción del ruido.
La efectividad de un filtro mediano dependería del tipo de ruido. El ruido con un valor medio de 0, por ejemplo, ruido gaussiano blanco aditivo (AWGN) se reduciría bastante bien si se obtuvieran muestras suficientes. Si el ruido es alguna otra forma de interferencia (desvanecimiento por trayectos múltiples), un filtro mediano realmente no ayudará.
Nick T
Respuestas:
13
Intuición: la intuición es esta: su ruido es un evento o eventos que son raros y que, en comparación con otros eventos, parecen valores atípicos que realmente no deberían estar allí.
Por ejemplo, si está midiendo las velocidades de cada automóvil en la carretera cuando pasan junto a usted y los traza, verá que generalmente están en el rango de, por ejemplo, mph a mph. Sin embargo, mientras inspecciona sus datos para su jefe, verá que registró una velocidad de mph. Este valor no solo no tiene sentido físico para la velocidad de un automóvil real en una carretera, sino que también se destaca enormemente del resto de sus datos. Al atribuir este evento a algún error de medición extraño, lo elimina y le da el resto de sus datos a su jefe.50701,000,000
Sin embargo, a medida que continúa con sus mediciones día tras día, nota que de vez en cuando, obtiene esas mediciones salvajes de velocidad. Por ejemplo, en el lapso de 1 hora, mide 1000 autos, y sus velocidades están muy bien entre y mph, sin embargo, 3 de ellos tienen velocidades de mph, mph y mph, no solo rompiendo las leyes estatales locales, pero también los de la física teórica.507023,42412,000,121192,212,121,329,982,321,912
Te cansas de tener que entrar continuamente y eliminar esos puntos de datos errantes causados por tu radar barato a mano. Después de todo, su jefe realmente solo está interesado en las estadísticas de las velocidades, no tanto en cada valor real. Le gusta hacer buenos histogramas para sus jefes.
Esos números errantes y grandes son una especie de "ruido" que usted considera: "ruido" causado por su radar barato que compró en una casa de empeños con sombra. ¿Es el ruido aditivo ruido blanco gaussiano? (AWGN) Sí y no: su espectro es de banda ancha y blanco, pero es temporalmente raro, escaso y muy localizado. Es mejor referido como ruido de 'sal y pimienta' (especialmente en el dominio de procesamiento de imágenes).
Por lo tanto, lo que puede hacer es ejecutar sus datos a través de un filtro mediano . Su filtro de mediana tomará un bloque de, digamos, puntos de velocidad (puntos 1 a 5), encontrará la mediana y escupirá ese valor como la velocidad 'promedio'. Luego tomará los siguientes 5 puntos (puntos 2 a 6), tomará esa mediana y la escupirá como el promedio, etc.5
¿Qué sucede cuando te encuentras con una de tus velocidades más rápidas que la luz? Digamos que sus 5 velocidades fueron [45, 65, 50, 999999, 75]. Si tomó el promedio normal, su velocidad 'promedio' aquí será algo bastante grande. Sin embargo, si toma la mediana, su 'promedio' será 65. ¿Cuál se aproxima mejor al promedio que realmente está tratando de medir? La métrica mediana.
Por lo tanto, si filtra sus datos con un filtro mediano, se asegurará de eliminar esos valores atípicos y, por lo tanto, ha "cancelado" su señal fielmente. Por el contrario, si trató de eliminar su ruido mediante el filtrado tradicional (nada más que una suma ponderada en movimiento), en su lugar, 'difuminará' el error en sus datos y no lo eliminará.
Matemáticas: la matemática es esta: la medida mediana es lo que se conoce como estadística de orden . Es decir, devuelve el valor de sus datos, en algún momento, después de que se haya ordenado. El máximo y el mínimo también son estadísticas de pedido: devuelven los puntos extremos de sus datos después de que se hayan ordenado. Tomar la mediana también devuelve el valor de sus datos ordenados, pero desde el medio.
Pero, ¿por qué son diferentes de los filtros medios? Bueno, los filtros medios calculan un promedio utilizando todos los datos. Si observa desde max, min y median, obtendrá una respuesta sin utilizar todos los datos. De hecho, todo lo que hace la mediana es ordenar sus datos y elegir el valor en el medio. Nunca "toca" los valores atípicos, como esas grandes velocidades que midió.
Esta es la razón por la cual la mediana, una estadística de orden, puede 'eliminar' el ruido atípico para usted. El ruido atípico se segrega en frente de la mediana, y la mediana nunca se acerca o lo considera, mientras que le da una buena estimación de la tendencia central.
Suponiendo variables aleatorias independientes con distribuciones normales, la probabilidad de que un valor caiga más allá de, digamos, 2 desviaciones estándar será de aproximadamente 0.01.
Si tiene un filtro mediano de ancho 3, ese triplete debe contener dos valores atípicos en el mismo lado de la media para que pueda aparecer un valor atípico. Este evento tiene una probabilidad de 0.00005.2⋅0.0052=
A medida que el filtro mediano aumenta de ancho, la probabilidad de que un valor atípico se reduzca disminuye exponencialmente.
Respuestas:
Intuición: la intuición es esta: su ruido es un evento o eventos que son raros y que, en comparación con otros eventos, parecen valores atípicos que realmente no deberían estar allí.
Por ejemplo, si está midiendo las velocidades de cada automóvil en la carretera cuando pasan junto a usted y los traza, verá que generalmente están en el rango de, por ejemplo, mph a mph. Sin embargo, mientras inspecciona sus datos para su jefe, verá que registró una velocidad de mph. Este valor no solo no tiene sentido físico para la velocidad de un automóvil real en una carretera, sino que también se destaca enormemente del resto de sus datos. Al atribuir este evento a algún error de medición extraño, lo elimina y le da el resto de sus datos a su jefe.50 70 1,000,000
Sin embargo, a medida que continúa con sus mediciones día tras día, nota que de vez en cuando, obtiene esas mediciones salvajes de velocidad. Por ejemplo, en el lapso de 1 hora, mide 1000 autos, y sus velocidades están muy bien entre y mph, sin embargo, 3 de ellos tienen velocidades de mph, mph y mph, no solo rompiendo las leyes estatales locales, pero también los de la física teórica.50 70 23,424 12,000,121 192,212,121,329,982,321,912
Te cansas de tener que entrar continuamente y eliminar esos puntos de datos errantes causados por tu radar barato a mano. Después de todo, su jefe realmente solo está interesado en las estadísticas de las velocidades, no tanto en cada valor real. Le gusta hacer buenos histogramas para sus jefes.
Esos números errantes y grandes son una especie de "ruido" que usted considera: "ruido" causado por su radar barato que compró en una casa de empeños con sombra. ¿Es el ruido aditivo ruido blanco gaussiano? (AWGN) Sí y no: su espectro es de banda ancha y blanco, pero es temporalmente raro, escaso y muy localizado. Es mejor referido como ruido de 'sal y pimienta' (especialmente en el dominio de procesamiento de imágenes).
Por lo tanto, lo que puede hacer es ejecutar sus datos a través de un filtro mediano . Su filtro de mediana tomará un bloque de, digamos, puntos de velocidad (puntos 1 a 5), encontrará la mediana y escupirá ese valor como la velocidad 'promedio'. Luego tomará los siguientes 5 puntos (puntos 2 a 6), tomará esa mediana y la escupirá como el promedio, etc.5
¿Qué sucede cuando te encuentras con una de tus velocidades más rápidas que la luz? Digamos que sus 5 velocidades fueron [45, 65, 50, 999999, 75]. Si tomó el promedio normal, su velocidad 'promedio' aquí será algo bastante grande. Sin embargo, si toma la mediana, su 'promedio' será 65. ¿Cuál se aproxima mejor al promedio que realmente está tratando de medir? La métrica mediana.
Por lo tanto, si filtra sus datos con un filtro mediano, se asegurará de eliminar esos valores atípicos y, por lo tanto, ha "cancelado" su señal fielmente. Por el contrario, si trató de eliminar su ruido mediante el filtrado tradicional (nada más que una suma ponderada en movimiento), en su lugar, 'difuminará' el error en sus datos y no lo eliminará.
Matemáticas: la matemática es esta: la medida mediana es lo que se conoce como estadística de orden . Es decir, devuelve el valor de sus datos, en algún momento, después de que se haya ordenado. El máximo y el mínimo también son estadísticas de pedido: devuelven los puntos extremos de sus datos después de que se hayan ordenado. Tomar la mediana también devuelve el valor de sus datos ordenados, pero desde el medio.
Pero, ¿por qué son diferentes de los filtros medios? Bueno, los filtros medios calculan un promedio utilizando todos los datos. Si observa desde max, min y median, obtendrá una respuesta sin utilizar todos los datos. De hecho, todo lo que hace la mediana es ordenar sus datos y elegir el valor en el medio. Nunca "toca" los valores atípicos, como esas grandes velocidades que midió.
Esta es la razón por la cual la mediana, una estadística de orden, puede 'eliminar' el ruido atípico para usted. El ruido atípico se segrega en frente de la mediana, y la mediana nunca se acerca o lo considera, mientras que le da una buena estimación de la tendencia central.
fuente
Suponiendo variables aleatorias independientes con distribuciones normales, la probabilidad de que un valor caiga más allá de, digamos, 2 desviaciones estándar será de aproximadamente 0.01.
Si tiene un filtro mediano de ancho 3, ese triplete debe contener dos valores atípicos en el mismo lado de la media para que pueda aparecer un valor atípico. Este evento tiene una probabilidad de 0.00005.2⋅0.0052=
A medida que el filtro mediano aumenta de ancho, la probabilidad de que un valor atípico se reduzca disminuye exponencialmente.
fuente