Grayscale

Em fotografia, computação e colorimetria, uma imagem em tons de cinza ou em escala de cinza é aquela em que o valor de cada pixel é uma única amostra representando apenas uma quantidade de luz, ou seja, ela contém apenas informações de intensidade.Imagens desse tipo, também conhecidas como preto-e-branco ou monocromático, são compostas exclusivamente por tons de cinza, variando de preto na intensidade mais fraca até branco no mais forte.

As imagens em escala de cinza são distintas das imagens em preto e branco bitonais de um bit, que no contexto de imagens de computador são imagens com apenas duas cores, preto e branco (também chamadas de imagens binárias ou binárias). Imagens em tons de cinza têm muitos tons de cinza no meio.

As imagens em escala de cinza podem ser o resultado da medição da intensidade da luz em cada pixel de acordo com uma combinação ponderada de frequências (ou comprimentos de onda) e, nesses casos, são monocromáticas quando apenas uma freqüência (na prática, uma faixa estreita de freqüências ) é capturado. As frequências podem, em princípio, ser de qualquer parte do espectro eletromagnético (por exemplo, infravermelho, luz visível, ultravioleta, etc.).

Uma imagem em escala de cinza colorimétrica (ou mais especificamente fotométrica) é uma imagem que possui um espaço de cores definido em tons de cinza, que mapeia os valores de amostras numéricas armazenadas para o canal acromático de um espaço de cores padrão, que é baseado nas propriedades medidas da visão humana.

Se a imagem colorida original não tiver um espaço de cores definido ou se a imagem em tons de cinza não tiver a mesma intensidade acromática percebida pelo homem que a imagem colorida, não haverá mapeamento exclusivo de uma imagem colorida para uma imagem em tons de cinza.

Representações numéricas
A intensidade de um pixel é expressa dentro de um determinado intervalo entre um mínimo e um máximo, inclusive. Esse intervalo é representado de maneira abstrata como um intervalo de 0 (ou 0%) (ausência total, preto) e 1 (ou 100%) (presença total, branco), com qualquer valor fracionário entre eles. Essa notação é usada em trabalhos acadêmicos, mas isso não define o que é “preto” ou “branco” em termos de colorimetria. Às vezes a escala é invertida, como na impressão em que a intensidade numérica denota quanta tinta é empregada no meio-tom, com 0% representando o papel branco (sem tinta) e 100% sendo um preto sólido (tinta cheia).

Na computação, embora a escala de cinza possa ser calculada através de números racionais, os pixels da imagem são geralmente quantificados para armazená-los como números inteiros sem sinal, para reduzir o armazenamento e a computação necessários. Alguns monitores antigos em escala de cinza podem exibir até dezesseis tons diferentes, que seriam armazenados em formato binário usando 4 bits. Mas hoje as imagens em escala de cinza (como fotografias) destinadas à exibição visual (na tela e impressas) são normalmente armazenadas com 8 bits por pixel amostrado. Essa profundidade de pixel permite que 256 intensidades diferentes (ou seja, tons de cinza) sejam registradas e também simplifica o cálculo, pois cada amostra de pixel pode ser acessada individualmente como um byte completo. No entanto, se essas intensidades fossem espaçadas igualmente em proporção à quantidade de luz física que elas representam naquele pixel (chamado de escala ou codificação linear), as diferenças entre sombras escuras adjacentes poderiam ser notáveis ​​como artefatos de faixas, enquanto muitas das cores mais claras seria “desperdiçado” codificando muitos incrementos perceptivelmente indistinguíveis. Portanto, as tonalidades são normalmente distribuídas uniformemente em uma escala não linear comprimida por gama, que se aproxima melhor de incrementos perceptivos uniformes para tons escuros e claros, o que geralmente torna esses 256 tons suficientes (apenas um pouco) para evitar incrementos notáveis.

Os usos técnicos (por exemplo, em aplicações de imagens médicas ou sensoriamento remoto) geralmente exigem mais níveis, para fazer uso total da precisão do sensor (normalmente 10 ou 12 bits por amostra) e para reduzir os erros de arredondamento nos cálculos. Dezesseis bits por amostra (65.536 níveis) geralmente são uma opção conveniente para esses usos, já que os computadores gerenciam palavras de 16 bits com eficiência. Os formatos de arquivo de imagem TIFF e PNG (entre outros) suportam nativamente a escala de cinza de 16 bits, embora os navegadores e muitos programas de imagem tendam a ignorar os 8 bits de baixa ordem de cada pixel. Internamente para computação e armazenamento de trabalho, o software de processamento de imagem normalmente usa números inteiros ou de ponto flutuante de tamanho 16 ou 32 bits.

Convertendo cor em escala de cinza
A conversão de uma imagem colorida arbitrária em escala de cinza não é exclusiva em geral; O peso diferente dos canais de cor representa efetivamente o efeito de fotografar filme preto-e-branco com filtros fotográficos de cores diferentes nas câmeras.

Conversão colorimétrica (preservação de luminosidade perceptual) para tons de cinza

Uma estratégia comum é usar os princípios da fotometria ou, mais amplamente, a colorimetria para calcular os valores em escala de cinza (no espaço de cores da escala de cinza alvo) para ter a mesma luminância (tecnicamente relativa) da imagem colorida original (de acordo com seu espaço de cores) . Além da mesma luminância (relativa), este método também assegura que ambas as imagens tenham a mesma luminância absoluta quando exibidas, como pode ser medido por instrumentos em seus SIunits de candelas por metro quadrado, em qualquer área da imagem, dado pontos brancos iguais. A luminância em si é definida usando um modelo padrão de visão humana, preservando assim a luminância na imagem em tons de cinza também perserva outras medidas de leveza perceptiva, como L * (como no espaço de cores 1976 CIE L ab) que é determinado pela luminância linear Y em si (como no espaço de cor CIE 1931 XYZ ) ao qual nos referiremos aqui como Y linear para evitar qualquer ambiguidade.

Conversão colorimétrica (preservação de luminosidade perceptual) para tons de cinza
Uma estratégia comum é usar os princípios da fotometria ou, mais amplamente, a colorimetria para calcular os valores em escala de cinza (no espaço de cores da escala de cinza) para ter a mesma luminância (tecnicamente relativa) da imagem colorida original (de acordo com seu espaço de cores). ). Além da mesma luminância (relativa), este método também garante que ambas as imagens tenham a mesma luminância absoluta quando exibidas, como pode ser medido por instrumentos em suas unidades SI de candelas por metro quadrado, em qualquer área da imagem, dados pontos brancos iguais. A luminância em si é definida usando um modelo padrão de visão humana, preservando assim a luminância na imagem em tons de cinza também perserva outras medidas de leveza perceptiva, como L * (como no espaço de cores 1976 CIE Lab) que é determinado pela própria luminância linear (como no espaço de cor CIE 1931 XYZ) a que nos referiremos aqui como Ylinear para evitar qualquer ambiguidade.

Para converter uma cor de um espaço de cores baseado em um típico modelo de cores RGB (não linear) para uma representação em escala de cinza de sua luminância, a função de compactação gama deve primeiro ser removida por meio de expansão gama (linearização) para transformar a imagem em RGB linear. espaço de cores, de modo que a soma ponderada apropriada possa ser aplicada aos componentes de cor linear  ) para calcular a luminância linear Y linear , que pode então ser novamente comprimida por gama, se o resultado em escala de cinza também for codificado e armazenado em um espaço de cores não linear típico.

Para o espaço de cores sRGB comum, a expansão gama é definida como


onde C srgb representa qualquer um dos três primários sRGB comprimidos ( R srgb , G srgb e B srgb , cada um na faixa [0,1]) e Clinear é o valor da intensidade linear correspondente ( R linear , G linear , e B linear , também na faixa [0,1]. Então, a luminância linear é calculada como uma soma ponderada dos três valores de intensidade linear. O espaço de cores sRGB é definido em termos da luminância linear CIE 1931 Y linear , que é dada por


Estes três coeficientes particulares representam a percepção da intensidade (luminância) de humanos típicos de trichromat à luz do exato Rec. 709 cores primárias aditivas (cromaticidades) que são usadas na definição de sRGB. A visão humana é mais sensível ao verde, então isso tem o maior valor de coeficiente (0,7152), e menos sensível ao azul, então este tem o menor coeficiente (0,0722). Para codificar a intensidade da escala de cinza em RGB linear, cada um dos três componentes de cor pode ser definido para igualar a luminância linear calculada  (substituindo  pelos valores  para obter essa escala de cinza linear), que normalmente precisa ser compactada por gama para retornar a uma representação não linear convencional. Para sRGB, cada uma de suas três primárias é então ajustada para o mesmo srgbY comprimido pela gama dada pelo inverso da expansão gama acima como


Como os três componentes sRGB são então iguais, indicando que na verdade é uma imagem cinza (não colorida), só é necessário armazenar esses valores uma vez, e chamamos isso de imagem em escala de cinza resultante. É assim que ele normalmente será armazenado em formatos de imagem compatíveis com sRGB que suportam uma representação em escala de cinza de canal único, como JPEG ou PNG. Navegadores da Web e outros softwares que reconhecem imagens sRGB devem produzir a mesma renderização para uma imagem em escala de cinza do que seria para uma imagem sRGB “colorida” com os mesmos valores em todos os três canais de cores.

Codificação Luma em sistemas de vídeo
Para imagens em espaços de cores como Y’UV e seus parentes, que são usados ​​em sistemas de TV e vídeo em cores padrão como PAL, SECAM e NTSC, um componente de luma não linear (Y ‘) é calculado diretamente a partir de intensidades primárias comprimidas por gama. como uma soma ponderada que, embora não seja uma representação perfeita da luminância colorimétrica, pode ser calculada mais rapidamente sem a expansão e compressão gama usadas nos cálculos fotométricos / colorimétricos. Nos modelos Y’UV e Y’IQ usados ​​por PAL e NTSC, o componente rec601 luma (Y ‘) é computado como


onde usamos o primo para distinguir esses valores não-lineares dos valores não lineares do sRGB (discutidos acima) que usam uma fórmula de compressão gama um tanto diferente, e dos componentes RGB lineares. O padrão ITU-R BT.709 usado para HDTV desenvolvido pelo ATSC usa diferentes coeficientes de cor, computando o componente luma como

 .
Embora estes sejam numericamente os mesmos coeficientes usados ​​em sRGB acima, o efeito é diferente porque aqui eles estão sendo aplicados diretamente aos valores com compressão gama ao invés dos valores linearizados. O padrão ITU-R BT.2100 para televisão HDR usa coeficientes diferentes, computando o componente luma como

 .
Normalmente, esses espaços de cores são transformados novamente em R’G’B não lineares antes da renderização para visualização. Na medida em que a precisão suficiente permanece, eles podem ser processados ​​com precisão.

Mas se o componente de luma Y ‘em si é usado diretamente como uma representação em escala de cinza da imagem colorida, a luminância não é preservada: duas cores podem ter a mesma luminância linear Y (e, portanto, diferente Y não linear como definido acima) e, portanto, parecem mais escuras ou mais claras para um ser humano típico do que a cor original. Da mesma forma, duas cores que têm a mesma luminância Y (e, portanto, a mesma Y srgb ) terão, em geral, uma luma diferente por qualquer uma das definições de Y ‘ luma acima.

As imagens coloridas são geralmente construídas de vários canais de cores empilhadas, cada uma delas representando os níveis de valor do canal fornecido. Por exemplo, as imagens RGB são compostas por três canais independentes para os componentes de cores primárias vermelho, verde e azul; As imagens CMYK possuem quatro canais para placas de tinta ciano, magenta, amarelo e preto, etc.

Aqui está um exemplo de divisão de canal de cores de uma imagem colorida RGB completa. A coluna à esquerda mostra os canais de cores isolados em cores naturais, enquanto à direita estão suas equivalências em escala de cinza:

O inverso também é possível: criar uma imagem totalmente colorida a partir de seus canais de escala de cinza separados.Mangling canais, usando offsets, rotação e outras manipulações, efeitos artísticos podem ser alcançados em vez de reproduzir com precisão a imagem original.