Reducción de la resolución de una imagen por un factor entero

16

Cuando se disminuye la resolución de una imagen por un factor entero , el método obvio es establecer los píxeles de la imagen de salida en el promedio de los bloques n × n correspondientes en la imagen de entrada.nortenorte×norte

Recuerdo haber leído vagamente en alguna parte que este método no es óptimo (lo siento, no recuerdo ningún detalle)

¿Es cierto que hay un método mejor (y si es así, ¿dónde falla el método anterior, aunque parece "obviamente" correcto)? No sé mucho sobre el procesamiento de señales, esta pregunta solo me interesa.

Styg Oldenbaum
fuente
Si no tiene antecedentes en el procesamiento de la señal, la explicación de los legos es: existen mejores métodos para la disminución de la resolución. Su algoritmo de disminución de resolución técnicamente reducirá el tamaño de píxel de la imagen en N PERO el algoritmo descrito anteriormente se degradará en gran medida en calidad en comparación con mejores algoritmos de disminución de resolución.
Trevor Boyd Smith

Respuestas:

16

La disminución de una imagen reduce el número de muestras que pueden representar la señal. En términos de dominio de frecuencia, cuando una señal se muestrea por debajo, la porción de alta frecuencia de la señal se alias con la porción de baja frecuencia. Cuando se aplica al procesamiento de imágenes, el resultado deseado es preservar solo la porción de baja frecuencia. Para hacer esto, la imagen original debe ser preprocesada (filtrado de alias) para eliminar la porción de alta frecuencia para que no se produzca aliasing.


El filtro digital óptimo para eliminar la porción de alta frecuencia (con el corte más nítido) es la función sinc . La razón es que la representación del dominio de frecuencia de la función Sinc es casi 1 constante en toda la región de baja frecuencia, y casi constante 0 en toda la región de alta frecuencia.

sinc(X)=pecado(πX)πX

La respuesta al impulso del filtro sinc es infinita. El filtro de Lanczos es un filtro sinc modificado que atenúa los coeficientes sinc y los trunca una vez que los valores caen a insignificancia.


Sin embargo, ser óptimo en el dominio de la frecuencia no implica ser óptimo en los ojos humanos. Existen métodos de muestreo ascendente y descendente que no obedecen a las transformaciones lineales pero producen mejores resultados que los lineales.


norte×norte

El requisito mínimo en la correspondencia de coordenadas es que

  1. El muestreo ascendente de una imagen que contiene valores aleatorios arbitrarios por un factor entero, luego el muestreo descendente por el mismo factor entero, debe dar como resultado la misma imagen con un cambio numérico mínimo.
  2. El muestreo ascendente / descendente de una imagen que consta de un solo valor uniforme, seguido de la operación opuesta, debe dar como resultado una imagen que consista en el mismo valor uniformemente, con desviaciones numéricas mínimas.
  3. La aplicación repetida de pares de muestreo ascendente / descendente debería minimizar el cambio en el contenido de la imagen tanto como sea posible.
rwong
fuente
¿Qué quiere decir que la transformación de la función sinc sea "casi" 1 y 0 en las regiones respectivas?
@Tim: fenómeno de Gibbs cerca de la frecuencia de corte del filtro de sinc.
rwong
2
El remuestreo de Sinc solo tiene sentido en las señales que se perciben / procesan en el dominio de la frecuencia, como el audio. Las imágenes se perciben, al menos aproximadamente, en el dominio espacial (esto es discutible; es posible que alguna percepción de patrones repetidos esté en el dominio de la frecuencia) y cualquier transformación basada en el dominio de la frecuencia produce distorsiones desagradables (timbre, etc.) en el dominio espacial Básicamente, cualquier operación de convolución / lineal con cualquier coeficiente negativo producirá artefactos desagradables, y cualquier con todos los coeficientes no negativos producirá desenfoque.
R .. GitHub DEJA DE AYUDAR A ICE
6

Tiene razón en que el promedio de área es bastante cercano al "más correcto" que puede obtener, pero el problema es un comportamiento inconsistente al reducir la escala de una línea de ancho N por un factor de N. Si la ubicación de la línea está alineada módulo N, obtendrá una línea nítida de 1 píxel, pero si es aproximadamente N / 2 mod N, obtendrá una línea muy borrosa (2 píxeles de ancho a media intensidad). Esto puede verse muy mal, y con gamma no lineal, incluso resultará en diferencias de intensidad. (Idealmente, todo muestreo debe realizarse con gamma corregido para una escala de intensidad lineal, pero en la práctica casi nadie lo hace porque es realmente costoso).

Si desea mejorar esto, primero debe aceptar el hecho de que es imposible reducir el desenfoque en algunos casos, por lo que la única forma de obtener un resultado uniforme consiste en aumentar el desenfoque. La forma ideal es usar un núcleo gaussiano con un radio mayor que N / 2, en lugar de una función de paso, como la función de convolución con la imagen de origen. Sin embargo, una forma económica de abordar una aproximación, si ya tiene su implementación de promediación de área N-por-N, es simplemente aplicar una convolución borrosa (1 / 4,1 / 2,1 / 4) a la muestra disminuida resultante imagen.

R .. GitHub DEJA DE AYUDAR AL HIELO
fuente