Comprender los componentes Cb y Cr del espacio de color YCbCr

11

Estoy familiarizado con los espacios de colores aditivos (RGB), sustractivos (CMYK) y similares a HSV, pero un artículo que estoy tratando de entender actualmente funciona en YCbCr espacios de colores color para la segmentación de imágenes / definición de objetos.

Pasé la mayor parte de mi mañana buscando algo que explicara el YCbCr de forma natural, pero simplemente no lo entiendo. Obtuve una explicación agradable e intuitiva de la idea general detrás de este espacio de color aquí , y una explicación de cómo se usa para la codificación / compresión de imágenes de estos tipos (todo en la foto. SE).

Las fórmulas para calcular YCbCr a partir de RGB son fácilmente accesibles en wikipedia .

Obtuve la motivación para esta representación, obtuve que el componente Y contiene la información en escala de grises más importante (para el ojo humano) sobre la imagen.

Obtuve que Cb y Cr contienen información sobre los colores , y que (debido a la sensibilidad (in) del ojo humano), se pueden comprimir sin una pérdida visible de calidad. Pero, ¿qué representa realmente cada uno de los componentes de crominancia?

Como los autores del artículo mencionan que "la información de crominancia es primordial en la definición de los objetos" en su enfoque, y no puedo entender completamente lo que estoy leyendo con mi nivel actual de "Y es intensidad, Cb y Cr llevan información de color de alguna manera" entendiendo YCbCr.

Estoy buscando una respuesta en la línea "Cb es ..., mientras que Cr es ..." o "si imaginas mirar a través / con XY, en realidad estás mirando el componente Cb ...", o algo de otra manera, eso me ayudaría a comprender la información que llevan cada uno de los componentes por separado, no solo que ellos, juntos, llevan información de color.

EDITAR

Permítanme dar ejemplos de explicaciones intuitivas para otros espacios de color del tipo que estoy buscando:

RGB : como brillar una linterna de color en una pared negra: si brillas con una linterna azul, ves un reflejo azul. Si agrega una linterna roja, mostrará un reflejo magenta, que es una mezcla de azul y rojo.

CMYK : Al igual que al mezclar acuarelas, "agrega a los colores que refleja la superficie" (es decir, resta el color del fondo), de modo que si mezcla uno amarillo con uno cian, si refleja verde y obtendrá un color verde.

HSV : los niños pequeños se sienten atraídos por objetos altamente saturados, no brillantes (valor). El componente Hue es lo que "da el color", mientras que una baja saturación significa que el color está "diluido" en blanco. El cambio en el valor hace que todo sea más brillante o más oscuro.

Con estas definiciones, he podido tener una sensación intuitiva sobre lo que significa una representación de color en cada espacio de color, sin memorizar gráficos para cada uno de ellos.

penelope
fuente

Respuestas:

7

YUV (o YCbCr) es como HSV, pero en diferentes coordenadas. (La diferencia entre YUV e YCbCr es marginal, principalmente relacionada con fórmulas exactas).

V(S,H)(U,V)HS

U=Scos(H)

V=Specado(H)

Puedes ver esto enlace para más información.

Otra cosa para agregar a su lista de intuición:

La saturación es la pureza del color desde el punto de vista espectral . Por ejemplo, un láser tiene un espectro muy estrecho, lo que implica una alta saturación.

Andrey Rubshtein
fuente
¿Puedes agregar la explicación de la diferencia entre YUV y YCbCr, en aras de la integridad?
Penélope
@Andrey Rubshtein, si un láser tiene una alta saturación, ¿es verdad lo contrario? En otras palabras, si mido RGB y convierto a HSV, ¿implica una alta saturación que debe originarse en una fuente láser coherente? Gracias.
Frank
@Frank, no necesariamente un láser. Pero es difícil tener un color saturado con un amplio espectro, ya que cuanto más ancho es, más difícil es tener una alta respuesta en un solo componente.
Andrey Rubshtein
@Andrey Rubshtein, gracias por tu respuesta. Las unidades mks de intensidad de saturación son energía por unidad de tiempo por unidad de área. . Las unidades mks de fluencia de energía de saturación son energía por unidad de área. donde los pulsos láser de estado sólido son largos, de 10 a 50 ns (nanosegundos). ¿La alta saturación con un espectro muy estrecho implica que debe originarse en una fuente láser coherente?
Frank
@Andrey Rubshein. Tiene toda la razón ... Acabo de descubrir que los LED emiten luz que es prácticamente monocromática, al igual que las luces de sodio de baja presión. ¿Existen características distintivas de los punteros láser coherentes que se podrían usar para distinguir los rayos del puntero láser de la imagen general observada a través de la ventana de la cabina de una aerolínea Boeing 737?
Frank
2

No estoy seguro de lo que quiere decir con "en realidad", ya que ni RGB ni YUV representan la frecuencia de los fotones ni las típicas respuestas de varilla / cono de los ojos humanos. Pero puede ver cómo se ven sintetizando algunos parches de color YCrCb, como (1,1,0), (1, -1,0), (1,0,1), (1,0, - 1), etc.

Aquí hay una página de Wikipedia que incluye un gráfico:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

AGREGADO: RGB, y tal, casi fueron diseñados (o evolucionados) para coincidir con una posible comprensión intuitiva humana de la percepción (y los nombres de los colores resultan ser aprendidos culturalmente). YUV es lo opuesto, diseñado de tal manera que el ruido en el área UV (agregado a una ruidosa subbanda NTSC) sería difícil de ver y, por lo tanto, más difícil de describir. YCrCb es una variación del mismo mapeo de color. Por lo tanto, no busque una visión "intuitiva" existente, que puede no existir. Tal vez cree el suyo "aprendiendo" la tabla y construyendo algunas conexiones neuronales completamente nuevas que pueden no existir actualmente en su cerebro (o algo así).

hotpaw2
fuente
Agregué ejemplos para otros espacios de color del tipo que me gustaría obtener para YCbCr. Espero que esto aclare el tipo de explicación que estoy buscando.
Penélope
0

Cuando comprenda HSV / HSB, no debería ser difícil entender YCbCr. El canal B en HSB corresponde con el croma (croma = saturación http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/) Puede tomar una imagen rgb y convertirla a escala de grises o puede convertir todos los canales del RGB a escala de grises y los fusionan en un solo canal. Para simplificar, tengamos píxeles con 100% de rojo, 100% de verde y 70% de azul. Calculará el promedio ... (100 + 100 + 70) / 3 y obtendrá un valor del 90%, lo que significa un 90% de brillo. Entonces en escala de grises es de color gris muy claro. Ahora, si quisiéramos expresar los colores originales hacia el canal en escala de grises, necesitaríamos 3 fórmulas para cada color (rojo, verde, azul). Calcularía la diferencia de valor R vs escala de grises, G vs escala de grises y B vs escala de grises. Esto necesitaría 4 canales (RGB + croma). Pero podemos hacer lo mismo con 3 canales. Podemos hacer una pequeña corrección al canal verde. Calculemos la diferencia con el canal verde. El verde original es 100%, El nuevo valor del verde convertido en gris es del 90%. La diferencia es -10%. Así que cambiemos los canales R y B de este píxel por esta diferencia. Acabamos de hacer corrección gamma o todos los canales. Los valores del canal verde serán los mismos que para la imagen en escala de grises. Entonces ya no calculamos con el canal verde. El verde está "codificado" en el canal cromático Y ... El resto de colores (R, B) también se ajusta. R` = 90% del original o 100% de Y porque R y B son iguales en este ejemplo. El compuesto B tiene una diferencia de + 20% hacia el original, pero después de que se cambió con corrección gamma, tiene una diferencia de + 30% hacia Y. Para simplificarlo aún más, es como una fórmula en la que necesita agregar los tres compuestos. Las diferencias que obtienes para rojo y azul son Cb y Cr. Los personajes solo dicen que comparaste el canal azul con el canal cromático y el canal rojo con el canal cromático. Por lo tanto, Cb y Cr.

John Boe
fuente