Оттенки серого

В фотографии, вычислении и колориметрии изображение в оттенках серого или в оттенках серого — это изображение, в котором значение каждого пикселя представляет собой один образец, представляющий только количество света, то есть оно несет только информацию об интенсивности. Изображения такого рода, также называемые черно-белыми или монохромными, состоят исключительно из оттенков серого, от черного до самой низкой интенсивности до белого.

Изображения в оттенках серого отличны от однобитовых двухтоновых черно-белых изображений, которые в контексте компьютерного изображения представляют собой изображения только с двумя цветами, черно-белые (также называемые двууровневыми или двоичными изображениями). Изображения в оттенках серого имеют много оттенков серого между ними.

Изображения в оттенках серого могут быть результатом измерения интенсивности света на каждом пикселе в соответствии с определенной взвешенной комбинацией частот (или длин волн), и в таких случаях они являются монохроматическими, когда только одна частота (на практике, узкая полоса частот ). Частоты могут быть в принципе из любого места в электромагнитном спектре (например, инфракрасный, видимый, ультрафиолетовый и т. Д.).

Колориметрическое (или, более конкретно, фотометрическое) изображение в оттенках серого представляет собой изображение, которое имеет определенное цветовое пространство в оттенках серого, которое отображает сохраненные значения числовых выборок в ахроматический канал стандартного цветового пространства, который сам основан на измеренных свойствах человеческого зрения.

Если исходное цветное изображение не имеет определенного цветового пространства, или если изображение в оттенках серого не предназначено для того, чтобы иметь такую ​​же воспринятую человеком ахроматическую интенсивность, как цветное изображение, тогда нет уникального отображения от такого цветного изображения к полутоновому изображению.

Численные представления
Интенсивность пикселя выражается в заданном диапазоне между минимумом и максимумом, включительно. Этот диапазон представлен абстрактным образом как диапазон от 0 (или 0%) (общее отсутствие, черный) и 1 (или 100%) (общее присутствие, белый) с любыми дробными значениями между ними. Эти обозначения используются в научных статьях, но это не определяет, что такое «черный» или «белый» в терминах колориметрии. Иногда масштаб меняется на противоположное, как при печати, где числовая интенсивность означает, сколько чернил используется при полутонах, причем 0% представляют собой белую бумагу (без чернил), а 100% — сплошной черный (полная чернила).

В вычислениях, хотя оттенки серого могут быть вычислены с помощью рациональных чисел, пиксели изображений обычно квантуются, чтобы хранить их как целые числа без знака, чтобы уменьшить требуемое хранение и вычисление. Некоторые ранние мониторы в оттенках серого могут отображать только до шестнадцати разных оттенков, которые будут храниться в двоичной форме с использованием 4-бит. Но сегодня изображения в оттенках серого (например, фотографии), предназначенные для визуального отображения (как на экране, так и на печати), обычно хранятся с 8 битами на выборку пикселя. Эта глубина пикселей позволяет записывать 256 различных интенсивностей (т. Е. Оттенки серого), а также упрощает вычисление, поскольку каждый образец пикселя можно получить индивидуально, как один полный байт. Однако, если эти интенсивности были распределены поровну пропорционально количеству физического света, который они представляют на этом пикселе (называемом линейным кодированием или шкалой), различия между соседними темными оттенками могут быть весьма заметны, как артефакты группировки, в то время как многие из более светлых оттенков будет «потрачено впустую» путем кодирования большого количества незаметных приращений. Поэтому оттенки вместо этого обычно распределяются равномерно по гамма-сжатой нелинейной шкале, которая лучше приближается к равномерным перцептивным приращениям для темных и светлых оттенков, обычно делая эти 256 оттенков достаточно (едва ли), чтобы избежать заметных приращений.

Техническое использование (например, в медицинских изображениях или приложениях дистанционного зондирования) часто требует большего количества уровней, чтобы в полной мере использовать точность датчика (обычно 10 или 12 бит на образец) и уменьшать ошибки округления в вычислениях. Шестнадцать бит на выборку (65 536 уровней) часто являются удобным выбором для такого использования, поскольку компьютеры эффективно управляют 16-битными словами. TIFF и PNG (среди прочего) форматы файлов изображений поддерживают 16-битный оттенок серого изначально, хотя браузеры и многие программы обработки изображений имеют тенденцию игнорировать 8 бит каждого порядка каждого пикселя.Внутренне для вычислений и рабочего хранилища программное обеспечение для обработки изображений обычно использует целочисленные или с плавающей точкой номера размером 16 или 32 бит.

Преобразование цвета в оттенки серого
Преобразование произвольного цветного изображения в оттенки серого не является уникальным в целом; различное взвешивание цветовых каналов эффективно отражает эффект съемки черно-белой пленки с цветными фотографическими фильтрами на камерах.

Колориметрическое (перцептивное сохранение яркости) преобразование в оттенки серого

Общей стратегией является использование принципов фотометрии или, более широко, колориметрии для вычисления значений оттенков серого (в целевом цветовом пространстве оттенков серого), чтобы иметь ту же яркость (технически относительную яркость), что и исходное цветное изображение (в соответствии с его цветовым пространством) , В дополнение к той же (относительной) яркости, этот метод также гарантирует, что оба изображения будут иметь одинаковую абсолютную яркость при отображении, что может быть измерено инструментами в его единицах измерения кандела на квадратный метр в любой заданной области изображения, данной равные белые точки. Сама яркость определяется с использованием стандартной модели человеческого зрения, поэтому сохранение яркости в изображении в градациях серого также сохраняет другие измерения восприимчивости, такие как L * (как в цветовом пространстве CIE L ab 1976 года), который определяется линейной яркостью Y (как в цветовом пространстве CIE 1931 XYZ ), который мы будем называть здесь Y линейным, чтобы избежать какой-либо двусмысленности.

Колориметрическое (перцептивное сохранение яркости) преобразование в оттенки серого
Общей стратегией является использование принципов фотометрии или, более широко, колориметрии для расчета значений оттенков серого (в целевом цветовом пространстве оттенков серого), чтобы иметь ту же яркость (технически относительную яркость), что и исходное цветное изображение (в соответствии с его цветовым пространством ). В дополнение к той же (относительной) яркости этот метод также гарантирует, что оба изображения будут иметь одинаковую абсолютную яркость при отображении, что может быть измерено инструментами в единицах СИ канделяля на квадратный метр в любой заданной области изображения, при равных белых точках. Сама яркость определяется с использованием стандартной модели человеческого зрения, поэтому сохранение яркости в изображении в градациях серого также сохраняет другие измерения восприимчивости, такие как L * (как в цветовом пространстве CIE Lab 1976 1976 года), который определяется самой линейной яркостью Y (как в цветовом пространстве CIE 1931 XYZ), который мы будем называть здесь Ylinear, чтобы избежать какой-либо двусмысленности.

Чтобы преобразовать цвет из цветового пространства на основе типичной гамма-сжатой (нелинейной) цветовой модели RGB в полутоновое изображение ее яркости, функцию гамма-сжатия сначала необходимо удалить с помощью гамма-расширения (линеаризации), чтобы преобразовать изображение в линейный RGB цвета, так что соответствующая взвешенная сумма может быть применена к линейным компонентам цвета  ) для вычисления линейной яркости Y, линейной , которая затем может быть снова сжата гамма, если результат градации серого также должен быть закодирован и сохранен в типичном нелинейном цветовом пространстве.

Для общего цветового пространства sRGB расширение гаммы определяется как


где C srgb представляет собой любой из трех гамма-сжатых праймеров sRGB ( R srgb , G srgb и B srgb , каждый в диапазоне [0,1]), а C linear — соответствующее значение линейной интенсивности ( R linear , G linear , и B линейно , также в диапазоне [0,1]). Затем линейная яркость рассчитывается как взвешенная сумма трех значений линейной интенсивности.Цветовое пространство sRGB определяется в терминах линейной яркости CIE 1931 Y , которая задается формулой


Эти три конкретных коэффициента представляют собой восприятие интенсивности (яркости) типичных людей трихромата для освещения точной Rec. 709 добавочных первичных цветов (цветности), которые используются в определении sRGB.Человеческое зрение наиболее чувствительно к зеленому, поэтому оно имеет наибольшее значение коэффициента (0,7152) и наименее чувствительным к синему, поэтому он имеет наименьший коэффициент (0,0722). Чтобы кодировать интенсивность оттенков серого в линейном RGB, каждый из трех цветовых компонентов может быть установлен равным вычисленной линейной яркости  (замена  по значениям  для получения этого линейного оттенка серого), который затем, как правило, должен быть сжат гамма, чтобы вернуться к обычному нелинейному представлению. Для sRGB каждый из трех его праймериз затем устанавливается на тот же гамма-сжатый Y srgb, заданный инверсией гамма-расширения выше, как


Поскольку три компонента sRGB равны, что указывает на то, что на самом деле это серое изображение (а не цветное), нужно только один раз сохранить эти значения, и мы называем это полученным полутоновым изображением. Таким образом, он будет обычно храниться в форматах изображений, совместимых с sRGB, которые поддерживают одноканальное представление в оттенках серого, например JPEG или PNG. Веб-браузеры и другое программное обеспечение, которое распознает изображения sRGB, должно производить тот же рендеринг для такого изображения в градациях серого, что и для «цветного» изображения sRGB, имеющего одинаковые значения во всех трех цветовых каналах.

Кодирование Luma в видеосистемах
Для изображений в цветовых пространствах, таких как Y’UV и его родственники, которые используются в стандартных цветных телевизионных и видеосистемах, таких как PAL, SECAM и NTSC, нелинейный компонент яркости (Y ‘) рассчитывается непосредственно из гамма-сжатых первичных интенсивностей как взвешенную сумму, которая, хотя и не является идеальным представлением колориметрической яркости, может быть рассчитана более быстро без гамма-расширения и сжатия, используемых в фотометрических / колориметрических расчетах. В моделях Y’UV и Y’IQ, используемых PAL и NTSC, компонент яркости rec601 (Y ‘) вычисляется как


где мы используем простоту, чтобы отличить эти нелинейные значения от нелинейных значений sRGB (см. выше), которые используют несколько другую формулу сжатия гамма-излучения и от линейных компонентов RGB. Стандарт ITU-R BT.709, используемый для HDTV, разработанный ATSC, использует разные цветовые коэффициенты, вычисляя компонент яркости как

 ,
Хотя они численно совпадают с коэффициентами, использованными в sRGB выше, эффект отличается от того, что здесь они применяются непосредственно к гамма-сжатым значениям, а не к линеаризованным значениям. Стандарт ITU-R BT.2100 для телевидения HDR использует еще разные коэффициенты, вычисляя компонент яркости как

 ,
Обычно эти цветовые пространства преобразуются обратно в нелинейный R’G’B ‘перед рендерингом для просмотра. В той степени, в которой остается достаточная точность, они могут быть точно отображены.

Но если сам компонент яркости Y ‘вместо этого используется непосредственно как полутоновое изображение цветного изображения, яркость не сохраняется: два цвета могут иметь одну и ту же яркость Y’, но различную линейную яркость CIEY (и, следовательно, различные нелинейные Y srgb, как определено выше) и поэтому кажутся темнее или легче обычного человека, чем первоначальный цвет. Аналогично, два цвета, имеющие одну и ту же яркость Y (и, таким образом, один и тот же Y srgb ), будут в общем иметь разную яркость по одному из определений Y ‘ luma выше.

Цветные изображения часто построены из нескольких многоуровневых цветовых каналов, каждый из которых представляет уровни значений данного канала. Например, изображения RGB состоят из трех независимых каналов для красных, зеленых и синих основных компонентов цвета; Изображения CMYK имеют четыре канала для голубых, пурпурных, желтых и черных чернильных пластин и т. Д.

Вот пример расщепления цветного канала полного цветного изображения RGB. В столбце слева показаны изолированные цветовые каналы в естественных цветах, а справа — оттенки серого:

Также возможно обратное: создать полноцветное изображение из отдельных каналов оттенков серого. При использовании каналов, используя смещения, вращение и другие манипуляции, художественные эффекты могут быть достигнуты вместо точного воспроизведения исходного изображения.