グレースケール

写真撮影、コンピューティング、および比色測定では、グレースケールまたはグレースケールの画像は、各ピクセルの値が光量のみを表す単一のサンプルである、つまり輝度情報のみを運ぶ画像です。 この種の画像は、白黒またはモノクロとしても知られており、もっとも弱い強度の黒色から強い色の白色まで、灰色の色調で構成されています。

グレースケール画像は、1ビットの2階調の白黒画像とは異なります。コンピュータ画像のコンテキストでは、白​​黒の2色のみの画像(バイレベル画像またはバイナリ画像とも呼ばれます)があります。 グレースケール画像の間には多くの濃淡があります。

グレースケール画像は、特定の加重された周波数(または波長)の組み合わせに従って各ピクセルにおける光の強度を測定した結果であり得、そのような場合、単一周波数(実際には狭い周波数帯域)が捕捉される。 周波数は原則として、電磁スペクトル(例えば、赤外線、可視光線、紫外線など)のどこからでも可能である。

測色(またはより具体的に測光)グレースケール画像は、定義されたグレースケール色空間を有する画像であり、記憶された数値サンプル値を、それ自体が人間の視覚の測定された特性に基づく標準色空間の無彩色チャネルにマッピングする。

元のカラー画像に定義された色空間がない場合、またはグレースケール画像がカラー画像と同じ人間知覚無彩色強度を有することを意図していない場合、このようなカラー画像からグレースケール画像への一意のマッピングは存在しない。

数値表現
ピクセルの強度は、最小値と最大値との間の所与の範囲内で表される。 この範囲は、0(または0%)(合計不在、黒)と1(または100%)(合計存在、白)の範囲として抽象的に表現され、間に小数点があります。 この記法は学術論文で使用されていますが、これは測色の意味で「黒」または「白」が何であるかを定義していません。 場合によっては、数値強度がハーフトーン処理で使用されるインクの量を表し、0%が白(インクなし)を表し、100%が黒(完全なインク)である印刷の場合と同様に、スケールは逆転される。

計算では、グレースケールは有理数で計算することができますが、イメージピクセルは通常、符号なし整数として格納されるように量子化され、必要な格納と計算が減少します。 一部の初期のグレースケールモニタでは、最大16種類の濃淡だけを表示でき、4ビットを使用してバイナリ形式で保存されます。 しかし、今日(スクリーンや印刷の両方の)視覚的な表示を意図したグレースケールの画像(写真など)は、一般に、サンプリングされたピクセルあたり8ビットで保存されます。 このピクセル深度は、256個の異なる強度(すなわちグレーの濃淡)を記録することを可能にし、各ピクセルサンプルが1バイトとして個別にアクセスされるので計算も簡単になる。 しかし、これらの強度が、そのピクセルで表現する物理的な光の量に比例して均等に間隔を置いた場合(線形符号化またはスケールと呼ばれる)、隣接する濃い色合い間の差異はバンディングアーティファクトとしてかなり顕著になることがありますが、多くの知覚的に区別できない増分を符号化することによって「無駄」になるであろう。 したがって、暗い色と薄い色合いの両方で均一な知覚増分によく似ているガンマ圧縮非線形スケールでは、通常、色合いが均等に分散され、目立つインクリメントを避けるためにこれらの256色合いを(わずかに)

技術的用途(医療画像やリモートセンシングアプリケーションなど)では、センサの精度(通常1サンプルあたり10ビットまたは12ビット)を最大限に活用し、計算の丸め誤差を低減するために、より多くのレベルが必要になることがあります。 コンピュータが16ビットワードを効率的に管理するため、サンプルあたり16ビット(65,536レベル)がそのような用途にしばしば便利な選択肢です。 TIFFおよびPNG(他のものの中でも)画像ファイル形式は、ブラウザや多くの画像プログラムが各ピクセルの下位8ビットを無視する傾向がありますが、16ビットグレースケールをネイティブにサポートしています。 内部的には、計算および作業記憶のために、画像処理ソフトウェアは、通常、サイズ16または32ビットの整数または浮動小数点数を使用する。

色をグレースケールに変換する
任意のカラー画像をグレースケールに変換することは、一般的ではない。 カラーチャネルの異なる重み付けは、カメラ上の異なる色の写真フィルタを用いて白黒フィルムを撮影する効果を効果的に表す。

グレースケールへの比色(知覚輝度保存)変換

一般的な戦略は、(色空間に応じて)元のカラー画像と同じ輝度(技術的に相対的な輝度)を有するように、測光の原理、またはより広義には測色法を使用してグレースケール値を(目標グレースケール色空間内で) 。 同じ(相対)輝度に加えて、この方法は、表示されたときに両方の画像が同じ絶対輝度を有することを保証し、画像の任意の所与の領域において、単位面積当たりのカンデラ単位で測定することができる同等のホワイトポイント。 ルミナンス自体は、人間の視覚の標準モデルを使用して定義されるので、グレースケール画像のルミナンスを保存すると、線形輝度Yによって決まるL * (1976 CIE L ab色空間におけるような) (CIE 1931 XYZ色空間のように)それ自体は、ここではあいまいさを避けるためにY 線形として参照する。

グレースケールへの比色(知覚輝度保存)変換
一般的な戦略は、測色(より広義には測色)の原理を使用して、(目標のグレースケール色空間内の)グレースケール値を計算して、元のカラー画像と同じ輝度(技術的に相対的な輝度) )。 同じ(相対)輝度に加えて、この方法は、表示されたときに両方の画像が同じ絶対輝度を有することを保証し、画像の任意の所与の領域において、1平方メートル当たりのカンデラ単位のSI単位で測定することができ、与えられた等しい白色点。 ルミナンス自体は、人間の視覚の標準モデルを使用して定義されているため、グレースケール画像のルミナンスを保持すると、線形ルミナンスY自体によって決まるL *(1976 CIE Lab色空間におけるような) (CIE 1931 XYZ色空間のように)ここではあいまいさを避けるためにYlinearと呼んでいます。

典型的なガンマ圧縮(非線形)RGBカラーモデルに基づく色空間からその輝度のグレースケール表現に色を変換するには、ガンマ圧縮関数をまずガンマ展開(線形化)によって除去して画像を線形RGBに変換しなければならない適切な重み付けされた和を線形色成分に適用することができる  )を使用して線形輝度Y 線形を計算し、グレースケール結果もまた符号化され、典型的な非線形色空間に格納される場合には再びガンマ圧縮することができる。

Related Post

一般的なsRGB色空間では、ガンマ展開は次のように定義されます。


C srgbは、3つのガンマ圧縮sRGB原色( R srgb 、 G srgb 、 B srgb 、いずれも範囲[0,1])のいずれかを表し、 C linearは対応する線強度値( R linear 、 G linear 、また、 B 線形 、範囲[0,1]でも)。 そして、線形輝度は、3つの線形強度値の加重和として計算される。 sRGB色空間は、CIE1931線形輝度Y 線形で定義されます。


これらの3つの特定の係数は、正確なRecの光に対する典型的な三色ヒトの強度(輝度)知覚を表す。 sRGBの定義で使用される709の加法原色(色度)。 人間の視覚は緑色に最も敏感であるため、これは最大係数値(0.7152)を有し、青色に対して最も敏感ではないので、最小係数(0.0722)を有する。 線形RGBでグレースケール強度を符号化するために、3つの色成分のそれぞれを、計算された線形輝度と等しくなるように設定することができる  (置き換える  値によって  この線形グレースケールを得るため)、通常は従来の非線形表現に戻るためにガンマ圧縮される必要がある。 sRGBの場合、3つのプライマリのそれぞれは、上記のガンマ展開の逆数によって与えられる同じガンマ圧縮Y srgbに設定されます。


3つのsRGBコンポーネントは等しいので、実際にはグレーのイメージ(カラーではない)であることを示しています。これらの値を一度保存​​するだけで済みます。これをグレースケールイメージと呼びます。 これは通常、JPEGやPNGなどの単一チャネルのグレースケール表現をサポートするsRGB互換のイメージフォーマットで格納されます。 sRGBイメージを認識するWebブラウザおよびその他のソフトウェアは、3つのカラーチャネルすべてで同じ値を持つ「カラー」sRGBイメージの場合と同じように、グレースケールイメージに対して同じレンダリングを生成する必要があります。

ビデオシステムにおけるルーマ符号化
PAL、SECAM、NTSCなどの標準カラーテレビやビデオシステムで使用されるY’UVなどの色空間の画像では、非線形輝度成分(Y ‘)がガンマ圧縮原色強度から直接計算されます測色/比色計算に使用されるガンマ拡張および圧縮なしに、比色輝度の完全な表現ではないがより迅速に計算することができる加重和として、 PALおよびNTSCで使用されるY’UVおよびY’IQモデルでは、rec601ルマ(Y ‘)成分は次のように計算されます。


これらの非線形値を、多少異なるガンマ圧縮式を使用するsRGB非線形値(前述)と線形RGBコンポーネントと区別するために素数を使用します。 ATSCによって開発されたHDTVに使用されるITU-R BT.709規格は、異なる色係数を使用して、輝度成分を

 。
これらは上記のsRGBで使用されている数値的に同じ係数ですが、ここでは線形化された値ではなくガンマ圧縮された値に直接適用されるため、効果が異なります。 HDRテレビ用のITU-R BT.2100規格は、異なる係数を使用し、輝度成分を

 。
通常、これらの色空間は、レンダリングの前に非線形のR’G’B ‘に変換されて表示されます。 十分な精度が残っている限り、正確にレンダリングすることができます。

しかし、輝度成分Y ‘自体が代わりにカラー画像のグレースケール表現として直接使用される場合、輝度は保存されない。すなわち、2つの色は同じ輝度Y’を有するが、異なるCIE線形輝度Y (したがって、したがって、元の色よりも典型的な人間に対してより暗くまたはより明るく見える。 同様に、同じ輝度Y (したがって同じY srgb )を有する2つの色は、一般に、上記のY ‘輝度定義のいずれかによって異なる輝度を有する。

カラー画像は、しばしば、それぞれが所与のチャネルの値レベルを表す、いくつかの積み重ねられたカラーチャネルで構築される。 例えば、RGB画像は、赤色、緑色及び青色の原色成分に対して3つの独立したチャネルから構成され、 CMYK画像には、シアン、マゼンタ、イエロー、ブラックの4色のインクプレートなどがあります。

次に、フルRGBカラー画像のカラーチャンネル分割の例を示します。 左側の列には自然色の孤立したカラーチャネルが表示され、右側にはグレースケールの等価性があります。

また、別のグレースケールチャンネルからフルカラー画像を作成することも可能です。 オフセット、回転などの操作を使用してチャンネルをマングリングすることで、元の画像を正確に再現するのではなく、芸術的な効果を得ることができます。

Share