カラーバランス

写真と画像処理では、カラーバランスは、カラー(通常は赤、緑、青の原色)の強度の全体的な調整です。 この調整の重要な目標は、特定の色、特にニュートラルな色を正しくレンダリングすることです。 したがって、一般的な方法は、グレーバランス、ニュートラルバランスまたはホワイトバランスと呼ばれることがあります。 カラーバランスは、画像内の色の全体的な混合を変更し、色補正に使用されます。 カラーバランスの一般化されたバージョンは、ニュートラル以外の色を修正したり、意図的に変更して効果をもたらすために使用されます。

センサによって取得された画像データ(フィルムまたは電子画像センサ)は、取得された値から、色再現または表示に適した新しい値に変換されなければならない。 捕捉および表示プロセスのいくつかの局面は、捕捉センサが人間の目のセンサと一致しないこと、ディスプレイ媒体の特性が考慮されなければならないこと、および取得は表示の閲覧条件とは異なります。

一般的な画像編集アプリケーションでのカラーバランス動作は、通常、赤、緑、青のチャネルピクセル値に対して、カラー検出や再現モデルに関係なく直接的に動作します。 フィルム写真撮影では、通常、光の上またはカメラのレンズ上の色補正フィルターを使用することによって、カラーバランスが達成されます。

一般化されたカラーバランス
中立性を中立に保つための調整をホワイトバランスといい、フレーズカラーバランスとは、表示された画像の他の色が元のシーンの色と同じ一般的な外観を持つように見せる調整を指します。 特にシーン中のニュートラル(グレー、ニュートラル、ホワイト)の色は、再生中にニュートラルに見​​えることが重要です。

光源推定と適応
ほとんどのデジタルカメラには、マニュアル照明選択、自動ホワイトバランス、またはカスタムホワイトバランスのいずれかを使用して、シーン照明のタイプに基づいて色補正を選択する手段があります。 これらのプロセスのアルゴリズムは、一般化された色順応を実行する。

カラーバランスのための多くの方法が存在する。 カメラ上にボタンを設定することは、ユーザがシーン照明の性質をプロセッサに示す方法である。 いくつかのカメラの別の選択肢は、カメラがグレーカードまたは他の中立色のオブジェクトを指しているときに押すことができるボタンである。 これにより、周囲光の画像がキャプチャされ、デジタルカメラはその光の正しい色バランスを設定することができます。

どのようにカメラデータから周囲の照明を推定し、次にこの情報を用いて画像データを変換するかについての大きな文献がある。 様々なアルゴリズムが提案されており、これらの品質が議論されている。 いくつかの例とその中の参考文献の検討は、読者を多くの人々に導くだろう。 例としては、Retinex、人工ニューラルネットワーク、ベイジアン法などがあります。

有彩色
画像のカラーバランスは、中立だけでなく他の色にも影響します。 色のバランスが取れていない画像は、画像のすべてが1つの色に向かって移動しているように見えるので、色のキャストがあると言われています。

カラーバランスも色の恒常性に関連しています。 色の不変性を達成するために使用されるアルゴリズムおよび技法は、カラーバランスのためによく使用される。 色の不変性は、順に、色順応に関連する。 概念的には、カラーバランシングは、2つのステップからなる。まず、画像が取り込まれた光源を決定する。 第2に、画像の成分(例えば、R、G、およびB)をスケーリングするか、または他の方法でそれらの成分を表示光源に適合するように変換する。

Viggianoは、カメラのネイティブRGBカラーモデルのホワイトバランス調整が、4000以上の仮想カメラ感度のセットに対して、モニタRGBよりも色の不規則性(すなわち、色の歪み)が少ない傾向があることを発見しました。 この差は、通常、カメラRGBを優先して2倍以上になります。 これは、後でモニタで編集するのではなく、画像がキャプチャされた時点でカラーバランスを取得することが有利であることを意味します。 後で色バランスを調整する必要がある場合、生の画像データのバランスをとることで、モニタRGBでのバランスよりも有彩色の歪みが少なくなる傾向があります。

カラーバランスの数学
3×3マトリクスを用いて、3成分画像(例えば、RGB)上でカラーバランスを行うことがある。 このタイプの変換は、デジタルカメラで間違ったホワイトバランス設定を使用してイメージをキャプチャした場合、またはカラーフィルタを使用してイメージをキャプチャした場合に適しています。

スケーリングモニタR、G、B
原理的には、イメージ内のすべての相対的な輝度をスケールして、中立と思われるオブジェクトが現れるようにしたい。 たとえば、R = 240のサーフェスが白いオブジェクトであると考えられ、255が白に対応するカウントである場合、すべての赤の値に255/240を掛けることができます。 緑と青に似ていることは、少なくとも理論的には、色のバランスの取れた画像になります。 このタイプの変換では、3×3行列は対角行列です。


ここで、R、GおよびBは、画像内の画素の色バランスのとれた赤色、緑色および青色成分であり、 R ‘、G’、B ‘はカラーバランス前の画像の赤、緑、青成分であり、R’ _ {w}、G ‘_ {w}、B’ _ { 、緑、青の成分を含み、これは、カラーバランスが取られる前の画像において白い表面であると考えられる。 これは、赤、緑、青のチャンネルの単純なスケーリングであり、PhotoshopとGIMPのカラーバランスツールには白いスポイトツールが使用されています。 sRGBによって仮定された蛍光体セットでホワイトバランスをとることは、ニュートラルな表面を完全に中立にすることができるにもかかわらず、有彩色で大きな誤差を生じる傾向があることが実証されている。

X、Y、Zのスケーリング
画像をCIE XYZ三刺激値に変換することができる場合には、色バランスをそこで行うことができる。 これは「間違ったフォン・クリス」変換と呼ばれています。 モニタRGBのバランスをとるよりも通常は劣悪な結果が出ることが示されていますが、ここでは他のものとの橋渡しとして言及されています。 数学的には、


ここで、X、Y、およびZは色バランスのとれた三刺激値であり、 X_ {w}、Y_ {w}、Z_ {w}は、観察光源の三刺激値(画像がそれに適合するように変換される白色点)である。 色バランスのとれていない画像において白であると考えられる物体の三刺激値であり、X ‘、Y’、Z ‘ ‘は、色バランスのとれていない画像内の画素の三刺激値である。 モニタ原色の三刺激値がマトリックス内にある場合 \ mathbf {P} そのため:


L_ {R}、L_ {G}、およびL_ {B}はガンマ補正されていないモニタRGBであり、


フォン・クリスの方法
網膜の棒と3つのカラーセンシティブコーンタイプの理論が100年以上にわたりカラーセンセーションの支配的説明として生き残っているJohannes von Kriesは、色をLMS色空間に変換する方法に動機づけて、独立して適応するようにモデル化された長波長、中波長、短波長のコーンタイプ。 3×3マトリックスはRGBまたはXYZをLMSに変換し、3つのLMS 1次値をスケーリングしてニュートラルのバランスをとります。 次に、その色を所望の最終色空間に変換することができる。


ここで、L、M、およびSは色バランスの取られたLMS円錐三刺激値であり、 色バランスの取れていない画像において白であると考えられる物体の三刺激値であり、L ‘、W’、S ‘ ‘は、色バランスのとれていない画像内の画素の三刺激値である。

LMS空間に変換する行列はvon Kriesによって指定されていませんが、後者が指定されている場合はCIEカラーマッチング関数とLMSカラーマッチング関数から導出できます。 マトリックスは参考書にもあります。

スケーリングカメラRGB
Viggianoの尺度で、ガウスカメラのスペクトル感度のモデルを使用すると、ほとんどのカメラRGB空間はRGBまたはXYZを監視するよりも優れていました。 カメラの生のRGB値が分かっている場合は、3×3の対角行列を使用することができます。


バランシング後にsRGBやAdobe RGBなどの動作中のRGB空間に変換します。

好ましい色順応空間
多数の異なるRGB空間における対角変換によってバランスされた画像の比較により、いくつかのカラーアピアランスモデルによって測定される、色順応のために、カメラ空間またはモニタ空間よりも優れているいくつかの空間が、 使用された画像テストセットの大部分において統計的にも最良にも実施されたシステムは、「シャープ」、「ブラッドフォード」、「CMCCAT」および「ROMM」スペースであった。

一般的な光源適応
光源の変化に適応するための最良のカラーマトリクスは、必ずしも固定色空間内の対角マトリクスである必要はない。 光源の空間がN個の基底項を有する線形モデルとして記述できる場合、適切な色変換はN個の固定線形変換の加重和であり、必ずしも一様に対角化可能ではないことは、長い間知られている。