Categories: Technologie

Binärbild

Ein Binärbild ist ein digitales Bild, das nur zwei mögliche Werte für jedes Pixel aufweist. Typischerweise sind die zwei für ein Binärbild verwendeten Farben schwarz und weiß. Die für die Objekte im Bild verwendete Farbe ist die Vordergrundfarbe, während der Rest des Bildes die Hintergrundfarbe ist. In der Dokumentenscanning-Industrie wird dies oft als „bitonal“ bezeichnet.

Binärbilder werden auch als zweistufig oder zweistufig bezeichnet. Dies bedeutet, dass jedes Pixel als ein einzelnes Bit gespeichert wird, dh als 0 oder 1. Für dieses Konzept werden häufig die Namen Schwarz-Weiß, Schwarzweiß, Monochrom oder Monochrom verwendet, es können jedoch auch Bilder mit nur einem Sample angegeben werden pro Pixel, z. B. Graustufenbilder. Im Photoshop-Sprachgebrauch entspricht ein Binärbild einem Bild im „Bitmap“ -Modus.

Binäre Bilder entstehen oft bei der digitalen Bildverarbeitung als Masken oder als Ergebnis bestimmter Operationen wie Segmentierung, Schwellenbildung und Dithering. Einige Eingabe- / Ausgabegeräte wie Laserdrucker, Faxgeräte und Bilevel-Computeranzeigen können nur Bilevel-Bilder verarbeiten.

Ein Binärbild kann im Speicher als eine Bitmap gespeichert werden, eine gepackte Anordnung von Bits. Ein 640 × 480 Bild benötigt 37,5 KiB Speicher. Aufgrund der geringen Größe der Bilddateien verwenden Faxgeräte und Dokumentenmanagement-Lösungen normalerweise dieses Format. Die meisten binären Bilder können auch mit einfachen Komprimierungsschemata für die Lauflänge komprimiert werden.

Binärbilder können als Teilmengen des zweidimensionalen ganzzahligen Gitters Z2 interpretiert werden; Das Feld der morphologischen Bildverarbeitung wurde weitgehend von dieser Sichtweise inspiriert.

Operationen auf Binärbildern
Eine ganze Klasse von Operationen an binären Bildern arbeitet an einem 3 × 3-Fenster des Bildes. Dieser enthält neun Pixel, also 512 (2 ^ 9) mögliche Werte. Wenn nur das zentrale Pixel betrachtet wird, kann basierend auf den umgebenden Pixeln definiert werden, ob es gesetzt oder nicht gesetzt bleibt. Beispiele für solche Operationen sind Ausdünnen, Dilatieren, Finden von Verzweigungspunkten und Endpunkten, Entfernen isolierter Pixel, Verschieben des Bildes um ein Pixel in irgendeine Richtung und Aufbrechen von H-Verbindungen. Conways Spiel des Lebens ist auch ein Beispiel für eine 3 × 3 Fensteroperation.

Eine andere Klasse von Operationen basiert auf dem Gedanken der Filterung mit einem strukturierenden Element. Das strukturierende Element ist ein binäres Bild, üblicherweise klein, das ähnlich wie ein Filter in der Graustufenbildverarbeitung über das Zielbild geleitet wird. Da die Pixel nur zwei Werte haben können, sind die morphologischen Operationen Erosion (jegliche nicht gesetzten Pixel innerhalb des Strukturierungselements bewirken, dass das Pixel unscharf ist) und Dilatation (irgendwelche gesetzten Pixel innerhalb des Strukturierungselements bewirken, dass das Pixel gesetzt wird). Wichtige Operationen sind die morphologische Öffnung und das morphologische Schließen, die aus Erosion gefolgt von Dilatation und Dilatation gefolgt von Erosion bestehen, wobei dasselbe Strukturierungselement verwendet wird. Öffnung neigt dazu, kleine Löcher zu vergrößern, kleine Objekte zu entfernen und Objekte zu trennen. Beim Schließen werden kleine Objekte beibehalten, Löcher entfernt und Objekte verbunden.

Related Post

Ein sehr wichtiges Merkmal eines Binärbildes ist die Abstandstransformation. Dies ergibt die Entfernung jedes gesetzten Pixels von dem nächsten nicht gesetzten Pixel. Die Abstandstransformation kann effizient berechnet werden. Es ermöglicht eine effiziente Berechnung von Voronoi-Diagrammen, wobei jedes Pixel in einem Bild dem nächsten einer Menge von Punkten zugeordnet wird. Es ermöglicht auch eine Skelettierung, die sich von der Ausdünnung dadurch unterscheidet, dass Skelette die Wiederherstellung des ursprünglichen Bildes ermöglichen. Die Abstandstransformation ist auch nützlich zum Bestimmen der Mitte des Objekts und zum Anpassen bei der Bilderkennung.

Eine andere Klasse von Operationen sammelt orientierungsfreie Metriken. Dies ist oft wichtig bei der Bilderkennung, wo die Ausrichtung der Kamera entfernt werden muss. Orientierungsfreie Metriken einer Gruppe von verbundenen oder umgebenen Pixeln umfassen die Euler-Zahl, den Umfang, die Fläche, die Kompaktheit, die Fläche der Löcher, den minimalen Radius, den maximalen Radius.

Bildsegmentierung
Binärbilder werden aus Farbbildern durch Segmentierung erzeugt. Die Segmentierung ist der Prozess, bei dem jedem Pixel im Quellbild zwei oder mehr Klassen zugewiesen werden. Wenn es mehr als zwei Klassen gibt, ist das übliche Ergebnis mehrere Binärbilder. Die einfachste Form der Segmentierung ist wahrscheinlich Otsus Methode, die basierend auf der Graustufenintensität Pixel dem Vordergrund oder Hintergrund zuordnet. Eine andere Methode ist der Watershed-Algorithmus. Die Kantenerkennung erzeugt häufig auch ein binäres Bild mit einigen Pixeln, die Randpixeln zugeordnet sind, und ist auch ein erster Schritt in der weiteren Segmentierung.

Skelette
Ausdünnung oder Skelettierung erzeugt binäre Bilder, die aus pixelbreiten Linien bestehen. Die Verzweigungspunkte und Endpunkte können dann extrahiert und das Bild in ein Diagramm umgewandelt werden. Dies ist wichtig bei der Bilderkennung, beispielsweise bei der optischen Zeichenerkennung.

Deutung
Die Interpretation des Binärwertes des Pixels ist ebenfalls geräteabhängig. Einige Systeme interpretieren den Bitwert von 0 als Schwarz und 1 als Weiß, während andere die Bedeutung der Werte umkehren. In der TWAIN-Standard-PC-Schnittstelle für Scanner und Digitalkameras heißt der erste Geschmack Vanille und die umgekehrte eine Schokolade.

Dithering wird häufig zum Anzeigen von Halbtonbildern verwendet.

Bildsensor erfasst binäre Bilder
Der überabgetastete binäre Bildsensor ist ein neuer Bildsensor, der an den traditionellen fotografischen Film erinnert. Jedes Pixel im Sensor hat eine binäre Antwort, die nur eine quantisierte Ein-Bit-Messung der lokalen Lichtintensität ergibt.

Share