Estoy familiarizado con los espacios de colores aditivos (RGB), sustractivos (CMYK) y similares a HSV, pero un artículo que estoy tratando de entender actualmente funciona en YCbCr espacios de colores color para la segmentación de imágenes / definición de objetos.
Pasé la mayor parte de mi mañana buscando algo que explicara el YCbCr de forma natural, pero simplemente no lo entiendo. Obtuve una explicación agradable e intuitiva de la idea general detrás de este espacio de color aquí , y una explicación de cómo se usa para la codificación / compresión de imágenes de estos tipos (todo en la foto. SE).
Las fórmulas para calcular YCbCr a partir de RGB son fácilmente accesibles en wikipedia .
Obtuve la motivación para esta representación, obtuve que el componente Y contiene la información en escala de grises más importante (para el ojo humano) sobre la imagen.
Obtuve que Cb y Cr contienen información sobre los colores , y que (debido a la sensibilidad (in) del ojo humano), se pueden comprimir sin una pérdida visible de calidad. Pero, ¿qué representa realmente cada uno de los componentes de crominancia?
Como los autores del artículo mencionan que "la información de crominancia es primordial en la definición de los objetos" en su enfoque, y no puedo entender completamente lo que estoy leyendo con mi nivel actual de "Y es intensidad, Cb y Cr llevan información de color de alguna manera" entendiendo YCbCr.
Estoy buscando una respuesta en la línea "Cb es ..., mientras que Cr es ..." o "si imaginas mirar a través / con XY, en realidad estás mirando el componente Cb ...", o algo de otra manera, eso me ayudaría a comprender la información que llevan cada uno de los componentes por separado, no solo que ellos, juntos, llevan información de color.
EDITAR
Permítanme dar ejemplos de explicaciones intuitivas para otros espacios de color del tipo que estoy buscando:
RGB : como brillar una linterna de color en una pared negra: si brillas con una linterna azul, ves un reflejo azul. Si agrega una linterna roja, mostrará un reflejo magenta, que es una mezcla de azul y rojo.
CMYK : Al igual que al mezclar acuarelas, "agrega a los colores que refleja la superficie" (es decir, resta el color del fondo), de modo que si mezcla uno amarillo con uno cian, si refleja verde y obtendrá un color verde.
HSV : los niños pequeños se sienten atraídos por objetos altamente saturados, no brillantes (valor). El componente Hue es lo que "da el color", mientras que una baja saturación significa que el color está "diluido" en blanco. El cambio en el valor hace que todo sea más brillante o más oscuro.
Con estas definiciones, he podido tener una sensación intuitiva sobre lo que significa una representación de color en cada espacio de color, sin memorizar gráficos para cada uno de ellos.
fuente
No estoy seguro de lo que quiere decir con "en realidad", ya que ni RGB ni YUV representan la frecuencia de los fotones ni las típicas respuestas de varilla / cono de los ojos humanos. Pero puede ver cómo se ven sintetizando algunos parches de color YCrCb, como (1,1,0), (1, -1,0), (1,0,1), (1,0, - 1), etc.
Aquí hay una página de Wikipedia que incluye un gráfico:
http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png
AGREGADO: RGB, y tal, casi fueron diseñados (o evolucionados) para coincidir con una posible comprensión intuitiva humana de la percepción (y los nombres de los colores resultan ser aprendidos culturalmente). YUV es lo opuesto, diseñado de tal manera que el ruido en el área UV (agregado a una ruidosa subbanda NTSC) sería difícil de ver y, por lo tanto, más difícil de describir. YCrCb es una variación del mismo mapeo de color. Por lo tanto, no busque una visión "intuitiva" existente, que puede no existir. Tal vez cree el suyo "aprendiendo" la tabla y construyendo algunas conexiones neuronales completamente nuevas que pueden no existir actualmente en su cerebro (o algo así).
fuente
Cuando comprenda HSV / HSB, no debería ser difícil entender YCbCr. El canal B en HSB corresponde con el croma (croma = saturación http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/) Puede tomar una imagen rgb y convertirla a escala de grises o puede convertir todos los canales del RGB a escala de grises y los fusionan en un solo canal. Para simplificar, tengamos píxeles con 100% de rojo, 100% de verde y 70% de azul. Calculará el promedio ... (100 + 100 + 70) / 3 y obtendrá un valor del 90%, lo que significa un 90% de brillo. Entonces en escala de grises es de color gris muy claro. Ahora, si quisiéramos expresar los colores originales hacia el canal en escala de grises, necesitaríamos 3 fórmulas para cada color (rojo, verde, azul). Calcularía la diferencia de valor R vs escala de grises, G vs escala de grises y B vs escala de grises. Esto necesitaría 4 canales (RGB + croma). Pero podemos hacer lo mismo con 3 canales. Podemos hacer una pequeña corrección al canal verde. Calculemos la diferencia con el canal verde. El verde original es 100%, El nuevo valor del verde convertido en gris es del 90%. La diferencia es -10%. Así que cambiemos los canales R y B de este píxel por esta diferencia. Acabamos de hacer corrección gamma o todos los canales. Los valores del canal verde serán los mismos que para la imagen en escala de grises. Entonces ya no calculamos con el canal verde. El verde está "codificado" en el canal cromático Y ... El resto de colores (R, B) también se ajusta. R` = 90% del original o 100% de Y porque R y B son iguales en este ejemplo. El compuesto B tiene una diferencia de + 20% hacia el original, pero después de que se cambió con corrección gamma, tiene una diferencia de + 30% hacia Y. Para simplificarlo aún más, es como una fórmula en la que necesita agregar los tres compuestos. Las diferencias que obtienes para rojo y azul son Cb y Cr. Los personajes solo dicen que comparaste el canal azul con el canal cromático y el canal rojo con el canal cromático. Por lo tanto, Cb y Cr.
fuente