Categories: AcadémicoTecnología

Escala de grises

En fotografía, computación y colorimetría, una escala de grises o una escala de grises es aquella en la que el valor de cada píxel es una sola muestra que representa solo una cantidad de luz, es decir, solo transporta información de intensidad. Las imágenes de este tipo, también conocidas como blanco y negro o monocromáticas, están compuestas exclusivamente por tonos de gris, que varían desde el negro en la intensidad más débil hasta el blanco en el más fuerte.

Las imágenes en escala de grises son distintas de las imágenes en blanco y negro de un bit, que en el contexto de imágenes por computadora son imágenes con solo dos colores, blanco y negro (también llamadas imágenes binarias o binarias). Las imágenes en escala de grises tienen muchos tonos de gris en el medio.

Las imágenes en escala de grises pueden ser el resultado de medir la intensidad de la luz en cada píxel según una combinación ponderada particular de frecuencias (o longitudes de onda), y en tales casos son monocromáticas cuando solo una frecuencia (en la práctica, una banda estrecha de frecuencias) ) Está capturado. Las frecuencias pueden, en principio, ser de cualquier parte del espectro electromagnético (p. Ej., Infrarrojo, luz visible, ultravioleta, etc.).

Una imagen colorimétrica (o más específicamente fotométrica) en escala de grises es una imagen que tiene un espacio de color definido en escala de grises, que mapea los valores de muestra numérica almacenados al canal acromático de un espacio de color estándar, que se basa en las propiedades medidas de la visión humana.

Si la imagen de color original no tiene un espacio de color definido, o si la imagen en escala de grises no tiene la misma intensidad acromática percibida por el ser humano que la imagen en color, entonces no hay un mapeo único desde una imagen de color a una escala de grises.

Representaciones numéricas
La intensidad de un píxel se expresa dentro de un rango dado entre un mínimo y un máximo, inclusive. Este rango se representa de forma abstracta como un rango de 0 (o 0%) (ausencia total, negro) y 1 (o 100%) (presencia total, blanco), con cualquier valor fraccionario en el medio. Esta notación se usa en trabajos académicos, pero esto no define qué es «negro» o «blanco» en términos de colorimetría. A veces la escala se invierte, como en la impresión, donde la intensidad numérica indica la cantidad de tinta empleada en medios tonos, donde el 0% representa el papel blanco (sin tinta) y el 100% es un negro sólido (tinta completa).

En computación, aunque la escala de grises se puede calcular a través de números racionales, los píxeles de la imagen generalmente se cuantifican para almacenarlos como enteros sin signo, para reducir el almacenamiento y el cálculo necesarios.Algunos monitores iniciales en escala de grises solo pueden mostrar hasta 16 tonos diferentes, que se almacenarán en forma binaria utilizando 4 bits. Pero hoy las imágenes en escala de grises (como las fotografías) destinadas a la visualización (tanto en pantalla como impresas) se almacenan comúnmente con 8 bits por píxel muestreado. Esta profundidad de píxeles permite registrar 256 intensidades diferentes (es decir, tonos de gris) y también simplifica el cálculo ya que se puede acceder a cada muestra de píxeles individualmente como un byte completo. Sin embargo, si estas intensidades estuvieran espaciadas igualmente en proporción a la cantidad de luz física que representan en ese píxel (llamada escala o codificación lineal), las diferencias entre sombras oscuras adyacentes podrían ser bastante notorias como artefactos de bandas, mientras que muchas de las sombras más claras sería «desperdiciado» al codificar una gran cantidad de incrementos perceptualmente indistinguibles. Por lo tanto, los tonos generalmente se distribuyen uniformemente en una escala no lineal comprimida gamma, que se aproxima mejor a los incrementos perceptuales uniformes para los tonos oscuros y claros, por lo general estos 256 tonos son suficientes (apenas) para evitar incrementos notables.

Los usos técnicos (por ejemplo, en imágenes médicas o aplicaciones de teledetección) a menudo requieren más niveles, para hacer un uso completo de la precisión del sensor (típicamente 10 o 12 bits por muestra) y para reducir los errores de redondeo en los cálculos. Dieciséis bits por muestra (65,536 niveles) es a menudo una opción conveniente para tales usos, ya que las computadoras administran las palabras de 16 bits de manera eficiente. Los formatos de archivo de imagen TIFF y PNG (entre otros) admiten escala de grises de 16 bits de forma nativa, aunque los navegadores y muchos programas de imágenes tienden a ignorar los 8 bits de orden bajo de cada píxel. Internamente para computación y almacenamiento de trabajo, el software de procesamiento de imágenes generalmente usa números enteros o en coma flotante de 16 o 32 bits.

Conversión de color a escala de grises
La conversión de una imagen de color arbitraria a escala de grises no es única en general; la diferente ponderación de los canales de color representa efectivamente el efecto de filmar película en blanco y negro con filtros fotográficos de diferentes colores en las cámaras.

Conversión colorimétrica (preservación de luminancia perceptual) a escala de grises

Una estrategia común es usar los principios de fotometría o, más ampliamente, colorimetría para calcular los valores de escala de grises (en el espacio de color de escala de grises objetivo) para tener la misma luminancia (luminancia relativa técnica) que la imagen de color original (según su espacio de color) . Además de la misma luminancia (relativa), este método también asegura que ambas imágenes tendrán la misma luminancia absoluta cuando se muestren, como se puede medir con los instrumentos en sus Unidades de candelas por metro cuadrado, en cualquier área dada de la imagen, dada puntos blancos iguales La luminancia misma se define utilizando un modelo estándar de visión humana, por lo que preservar la luminancia en la escala de grises también conserva otras medidas de luminosidad perceptual, como L * (como en el espacio de color CIE L ab 1976) que está determinada por la luminancia lineal Y en sí (como en el espacio de color CIE 1931 XYZ ) al que nos referiremos aquí como Ylineal para evitar cualquier ambigüedad.

Conversión colorimétrica (preservación de luminancia perceptual) a escala de grises
Una estrategia común es utilizar los principios de fotometría o, más ampliamente, colorimetría para calcular los valores de escala de grises (en el espacio de color de escala de grises objetivo) para tener la misma luminancia (luminancia relativa técnica) que la imagen de color original (según su espacio de color) ) Además de la misma luminancia (relativa), este método también asegura que ambas imágenes tendrán la misma luminancia absoluta cuando se muestren, como se puede medir con instrumentos en sus unidades SI de candelas por metro cuadrado, en cualquier área dada de la imagen, dado puntos blancos iguales La luminancia misma se define utilizando un modelo estándar de visión humana, por lo que preservar la luminancia en la escala de grises también conserva otras medidas de luminosidad perceptual, como L * (como en el espacio de color 1976 CIE Lab) que está determinada por la luminancia lineal Y misma (como en el espacio de color CIE 1931 XYZ) al que nos referiremos aquí como Ylinear para evitar cualquier ambigüedad.

Para convertir un color de un espacio de color basado en un modelo de color RGB típico gamma comprimido (no lineal) a una representación en escala de grises de su luminancia, primero se debe eliminar la función de compresión gamma mediante expansión gamma (linealización) para transformar la imagen en un RGB lineal espacio de color, para que la suma ponderada apropiada se pueda aplicar a los componentes de color lineales  ) para calcular la luminancia lineal Ylineal , que luego se puede volver a comprimir con gamma si el resultado de la escala de grises también debe codificarse y almacenarse en un espacio de color no lineal típico.

Related Post

Para el espacio de color sRGB común, la expansión de gamma se define como


donde C srgb representa cualquiera de los tres primarios sRGB comprimidos con gamma ( R srgb , G srgb y B srgb , cada uno en el rango [0,1]) y C lineal es el valor de intensidad lineal correspondiente ( R lineal , G lineal , y B lineal , también en rango [0,1]).Entonces, la luminancia lineal se calcula como una suma ponderada de los tres valores de intensidad lineal. El espacio de color sRGB se define en términos de la luminancia lineal CIE 1931 Y lineal , que viene dada por


Estos tres coeficientes particulares representan la percepción de la intensidad (luminancia) de humanos tricrómicos típicos a la luz de la Rec. 709 colores primarios aditivos (cromaticidades) que se usan en la definición de sRGB. La visión humana es más sensible al verde, por lo que tiene el mayor valor de coeficiente (0.7152) y es menos sensible al azul, por lo que tiene el menor coeficiente (0.0722). Para codificar la intensidad de escala de grises en RGB lineal, cada una de las tres componentes de color se puede configurar para igualar la luminancia lineal calculada  (reemplazando  por los valores  para obtener esta escala de grises lineal), que luego típicamente necesita ser comprimida con gamma para volver a una representación convencional no lineal. Para sRGB, cada uno de sus tres primarios se establece en el mismoYSrgb gamma-comprimido dado por el inverso de la expansión gamma anterior como


Debido a que los tres componentes sRGB son iguales, lo que indica que en realidad es una imagen gris (no color), solo es necesario almacenar estos valores una vez, y llamamos a esto la imagen resultante en escala de grises. Así es como normalmente se almacenará en formatos de imagen compatibles con sRGB que admitan una representación de escala de grises de un solo canal, como JPEG o PNG. Los navegadores web y otro software que reconozca las imágenes sRGB deben producir la misma representación para una imagen en escala de grises como lo haría para una imagen sRGB de «color» que tenga los mismos valores en los tres canales de color.

Codificación Luma en sistemas de video
Para imágenes en espacios de color como Y’UV y sus parientes, que se usan en sistemas de TV y video a color estándar como PAL, SECAM y NTSC, un componente de luma no lineal (Y ‘) se calcula directamente a partir de intensidades primarias comprimidas con gamma como una suma ponderada, que, aunque no es una representación perfecta de la luminancia colorimétrica, puede calcularse más rápidamente sin la expansión gamma y la compresión utilizadas en los cálculos fotométricos / colorimétricos. En los modelos Y’UV y Y’IQ utilizados por PAL y NTSC, el componente rec601 luma (Y ‘) se calcula como


donde usamos el primo para distinguir estos valores no lineales de los valores no lineales sRGB (discutidos anteriormente) que usan una fórmula de compresión gamma algo diferente, y de los componentes lineales RGB. El estándar ITU-R BT.709 utilizado para HDTV desarrollado por el ATSC usa diferentes coeficientes de color, computando el componente luma como

 .
Aunque estos son numéricamente los mismos coeficientes utilizados en sRGB anterior, el efecto es diferente porque aquí se están aplicando directamente a los valores comprimidos de gamma en lugar de a los valores linealizados. El estándar ITU-R BT.2100 para televisión HDR utiliza aún diferentes coeficientes, calculando el componente luma como

 .
Normalmente, estos espacios de color se transforman a R’G’B ‘no lineales antes de renderizar para su visualización. En la medida en que quede suficiente precisión, se pueden representar con precisión.

Pero si el componente luma Y ‘en sí mismo se usa directamente como una representación en escala de grises de la imagen en color, la luminancia no se conserva: dos colores pueden tener la misma luma Y’ pero diferente luminancia lineal CIE Y (y por lo tanto diferente Yrrb no lineal como se define arriba) y, por lo tanto, parece más oscuro o más claro para un humano típico que el color original. De forma similar, dos colores que tienen la misma luminancia Y (y por lo tanto el mismo Y srgb ) tendrán en general diferente luminancia por cualquiera de las definiciones de Y ‘ luma anteriores.

Las imágenes en color a menudo están compuestas de varios canales de color apilados, cada uno de los cuales representa los niveles de valor del canal dado. Por ejemplo, las imágenes RGB se componen de tres canales independientes para componentes de color primario rojo, verde y azul; Las imágenes CMYK tienen cuatro canales para placas de tinta cian, magenta, amarillo y negro, etc.

Aquí hay un ejemplo de división de canales de color de una imagen de color RGB completa. La columna de la izquierda muestra los canales de color aislados en colores naturales, mientras que a la derecha están sus equivalencias en escala de grises:

Lo contrario también es posible: crear una imagen a todo color desde sus canales de escala de grises por separado. Al modificar canales, usar desplazamientos, girar y otras manipulaciones, se pueden lograr efectos artísticos en lugar de reproducir con precisión la imagen original.

Share