二値画像

バイナリイメージは、各ピクセルに2つの可能な値しか持たないデジタルイメージです。 通常、2値画像に使用される2色は白黒です。 画像内のオブジェクトに使用される色は前景色であり、残りの画像は背景色である。 ドキュメントスキャニング業界では、これは「バイトーン」と呼ばれることがよくあります。

バイナリイメージは、バイレベルまたは2レベルとも呼ばれます。 これは、各ピクセルが単一のビット、すなわち0または1として記憶されることを意味する。白黒の名前、B&W、白黒またはモノクロームはこのコンセプトによく使用されるが、1つのサンプルのみを有する画像グレースケール画像など、ピクセルごとに表示されます。 Photoshop用語では、バイナリイメージは「ビットマップ」モードのイメージと同じです。

バイナリ画像は、マスクとして、またはセグメンテーション、閾値処理、ディザリングなどの特定の操作の結果として、デジタル画像処理でしばしば発生します。 レーザプリンタ、ファクシミリ、および2レベルコンピュータディスプレイなどのいくつかの入出力装置は、2値画像のみを扱うことができる。

バイナリイメージは、パックされたビットの配列であるビットマップとしてメモリに格納することができます。 640×480の画像には、37.5キロビットの記憶容量が必要です。 画像ファイルのサイズが小さいため、通常はファックス機や文書管理ソリューションでこの形式が使用されます。 ほとんどのバイナリイメージは、単純なランレングス圧縮方式でも圧縮されます。

バイナリ画像は、2次元整数格子Z2のサブセットとして解釈することができる。 形態学的画像処理の分野は、この見解によって大きく影響された。

バイナリイメージの操作
バイナリ画像に関する操作のクラス全体は、画像の3×3ウィンドウ上で動作する。 これには9つのピクセルが含まれているため、512(2 ^ 9)の値が可能です。 中心ピクセルのみを考慮すると、周囲のピクセルに基づいて、それが設定されたままであるか、または未設定であるかを定義することが可能である。 このような操作の例としては、間引き、拡大、分岐点と端点の発見、孤立したピクセルの削除、ピクセルの任意の方向へのシフト、H接続の切断などがあります。 ConwayのGame of Lifeは、3×3ウィンドウ操作の一例です。

別のクラスの操作は、構造化要素によるフィルタリングの概念に基づいています。 構造化要素は、グレースケール画像処理におけるフィルタと同様の方法で、ターゲット画像上を通過する、通常は小さいバイナリ画像である。 ピクセルは2つの値しか持つことができないため、形態学的操作は侵食(構造要素内の未設定のピクセルによってピクセルが設定解除される)と膨張(構造要素内の任意の設定ピクセルによってピクセルが設定されます)です。 重要な操作は、同じ構造要素を使用して、浸食とそれに続く膨張と膨張と侵食からなる形態学的開口と形態閉鎖である。 開口部は、小さな穴を拡大し、小さな物体を除去し、物体を分離する傾向がある。 閉じると、小さなオブジェクトが保持され、穴が削除され、オブジェクトが結合されます。

バイナリ画像の非常に重要な特性は距離変換である。 これにより、設定されているすべてのピクセルと最も近い未設定ピクセルとの距離が求められます。 距離変換を効率的に計算することができる。 これは、画像の各ピクセルが一組の点の最も近くに割り当てられるボロノイ図の効率的な計算を可能にする。 また、スケルトンは元のイメージの回復を可能にするスケーリングとは異なるスケルトン化を可能にします。 距離変換は、物体の中心を決定し、画像認識においてマッチングするためにも有用である。

オリエンテーションのないメトリクスを収集する作業の別のクラスがあります。 これは、カメラの向きを取り除く必要がある画像認識においてしばしば重要である。 接続されたピクセルまたは囲まれたピクセルのグループのオリエンテーションフリーのメトリックには、オイラー数、周囲、面積、コンパクトさ、穴の面積、最小半径、最大半径などがあります。

画像セグメンテーション
バイナリ画像は、セグメント化によってカラー画像から生成される。 セグメンテーションは、ソースイメージ内の各ピクセルを2つ以上のクラスに割り当てるプロセスです。 2つ以上のクラスがある場合、通常の結果はいくつかのバイナリイメージです。 最も簡単なセグメンテーションはおそらく大津の方法であり、グレースケール強度に基づいて前景または背景にピクセルを割り当てる。 別の方法は流域アルゴリズムです。 エッジ検出は、しばしばエッジ画素に割り当てられたいくつかのピクセルを有するバイナリ画像を生成し、また、さらなるセグメンテーションの第一歩でもある。

スケルトン
間引きまたはスケルトン化は、ピクセル幅の線で構成される2値画像を生成します。 その後、分岐点と端点を抽出し、画像をグラフに変換することができます。 これは、例えば光学式文字認識における画像認識において重要である。

解釈
ピクセルのバイナリ値の解釈もデバイスに依存します。 いくつかのシステムは0のビット値を黒と解釈し、1は白として解釈しますが、他のシステムは値の意味を逆転します。 スキャナーとデジタルカメラ用のTWAIN標準PCインターフェースでは、最初のフレーバーはバニラと呼ばれ、逆の1つのチョコレートと呼ばれます。

ディザリングは、多くの場合、ハーフトーン画像を表示するために使用されます。

画像センサ捕捉バイナリ画像
オーバーサンプリングされたバイナリイメージセンサは、従来の写真フィルムを連想させる新しいイメージセンサです。 センサ内の各ピクセルはバイナリ応答を有し、局所光強度の1ビット量子化測定値のみを与える。