Bei der Fotografie, der Berechnung und der Kolorimetrie ist ein Graustufen- oder Graustufenbild eines, bei dem der Wert jedes Pixels eine einzelne Probe ist, die nur eine Lichtmenge darstellt, das heißt, er enthält nur Intensitätsinformation. Bilder dieser Art, die auch als Schwarz-Weiß oder Monochrom bezeichnet werden, bestehen ausschließlich aus Grauschattierungen, die von Schwarz mit der schwächsten Intensität bis zu Weiß mit der stärksten Intensität reichen.

Graustufenbilder unterscheiden sich von binären Schwarzweiß-Schwarzweißbildern, die im Kontext der Computerbildgebung Bilder mit nur zwei Farben, Schwarz und Weiß, sind (auch Bilevel- oder Binärbilder genannt). Graustufenbilder haben viele Graustufen dazwischen.

Graustufenbilder können das Ergebnis der Messung der Intensität von Licht an jedem Pixel gemäß einer bestimmten gewichteten Kombination von Frequenzen (oder Wellenlängen) sein, und in solchen Fällen sind sie monochromatisch, wenn nur eine einzige Frequenz (in der Praxis ein schmales Frequenzband) ) ist gefangen. Die Frequenzen können prinzipiell von überall im elektromagnetischen Spektrum (z. B. Infrarot, sichtbares Licht, Ultraviolett etc.) sein.

Ein kolorimetrisches (oder genauer gesagt ein photometrisches) Graustufenbild ist ein Bild mit einem definierten Graustufenfarbraum, der die gespeicherten numerischen Abtastwerte auf den achromatischen Kanal eines Standardfarbraums abbildet, der selbst auf gemessenen Eigenschaften des menschlichen Sehvermögens basiert.

Wenn das ursprüngliche Farbbild keinen definierten Farbraum aufweist oder wenn das Graustufenbild nicht die gleiche vom Menschen wahrgenommene achromatische Intensität wie das Farbbild haben soll, gibt es keine eindeutige Abbildung von einem solchen Farbbild auf ein Graustufenbild.

Numerische Darstellungen
Die Intensität eines Pixels wird innerhalb eines gegebenen Bereichs zwischen einem Minimum und einem Maximum einschließlich ausgedrückt. Dieser Bereich wird in einer abstrakten Weise als ein Bereich von 0 (oder 0%) (totale Abwesenheit, schwarz) und 1 (oder 100%) (totale Präsenz, weiß) dargestellt, mit irgendwelchen Bruchwerten dazwischen. Diese Notation wird in akademischen Arbeiten verwendet, aber dies definiert nicht, was „schwarz“ oder „weiß“ in Bezug auf die Farbmessung ist. Manchmal ist die Skala umgekehrt, wie beim Drucken, wo die numerische Intensität angibt, wie viel Tinte bei der Rasterung verwendet wird, wobei 0% das Papierweiß (keine Tinte) und 100% ein Vollschwarz (volle Tinte) darstellt.

Obwohl die Grauskala durch rationale Zahlen berechnet werden kann, werden Bildpixel bei der Berechnung üblicherweise quantisiert, um sie als vorzeichenlose Ganzzahlen zu speichern, um die erforderliche Speicherung und Berechnung zu reduzieren.Einige frühe Graustufenmonitore können nur bis zu 16 verschiedene Schattierungen anzeigen, die in binärer Form mit 4 Bits gespeichert werden. Heutzutage werden Graustufenbilder (wie Fotos), die zur visuellen Anzeige (sowohl auf dem Bildschirm als auch gedruckt) gedacht sind, üblicherweise mit 8 Bits pro abgetastetem Pixel gespeichert. Diese Pixeltiefe erlaubt die Aufzeichnung von 256 verschiedenen Intensitäten (dh Graustufen) und vereinfacht auch die Berechnung, da auf jedes Pixelmuster einzeln als ein ganzes Byte zugegriffen werden kann. Wenn diese Intensitäten jedoch im gleichen Verhältnis zu der Menge an physikalischem Licht stehen, das sie an diesem Pixel darstellen (lineare Kodierung oder Skala genannt), können die Unterschiede zwischen benachbarten dunklen Tönen als Banding-Artefakte deutlich wahrnehmbar sein, während viele der helleren Tönungen auftreten würde „verschwendet“ werden, indem eine Menge von wahrnehmbar nicht unterscheidbaren Inkrementen codiert wird.Daher werden die Schattierungen stattdessen typischerweise gleichmäßig auf einer gamma-komprimierten nichtlinearen Skala ausgebreitet, die näherungsweise gleichmßige Wahrnehmungsinkremente für dunkle und helle Schattierungen annähert, wobei diese 256 Schattierungen gewöhnlich ausreichen (nur knapp), um merkliche Zunahmen zu vermeiden.

Technische Anwendungen (z. B. in medizinischen Bildgebungs- oder Fernerkundungsanwendungen) erfordern häufig mehr Pegel, um die Sensorgenauigkeit (typischerweise 10 oder 12 Bits pro Abtastwert) voll auszunutzen und Rundungsfehler bei Berechnungen zu reduzieren. Sechzehn Bits pro Abtastung (65.536 Stufen) sind oft eine geeignete Wahl für solche Anwendungen, da Computer 16-Bit-Wörter effizient verwalten. Die Bilddateiformate TIFF und PNG (unter anderem) unterstützen nativ 16-Bit-Graustufen, obwohl Browser und viele Bildbearbeitungsprogramme dazu neigen, die 8 Bits niedriger Ordnung jedes Pixels zu ignorieren. Intern für die Berechnung und den Arbeitsspeicher verwendet Bildverarbeitungssoftware typischerweise Ganzzahl- oder Fließkommazahlen der Größe 16 oder 32 Bits.

Konvertieren von Farbe in Graustufen
Die Konvertierung eines beliebigen Farbbildes in Graustufen ist im Allgemeinen nicht eindeutig; Eine unterschiedliche Gewichtung der Farbkanäle stellt effektiv die Wirkung dar, Schwarz-Weiß-Filme mit verschiedenfarbigen fotografischen Filtern auf den Kameras aufzunehmen.

Farbmetrische (wahrnehmungsleuchtdichte) Konvertierung in Graustufen

Eine allgemeine Strategie besteht darin, die Prinzipien der Photometrie oder allgemeiner Farbmetrik zu verwenden, um die Graustufenwerte (im Ziel-Graustufen-Farbraum) so zu berechnen, dass sie die gleiche Luminanz (technisch relative Luminanz) wie das ursprüngliche Farbbild (entsprechend ihrem Farbraum) aufweisen. . Zusätzlich zu der gleichen (relativen) Leuchtdichte stellt diese Methode auch sicher, dass beide Bilder die gleiche absolute Leuchtdichte haben, wenn sie angezeigt werden, wie durch Instrumente in ihren SI-Einheiten von Candela pro Quadratmeter in jedem gegebenen gegebenen Bildbereich gemessen werden kann gleiche Weißpunkte. Die Luminanz selbst wird unter Verwendung eines Standardmodells des menschlichen Sehens definiert, so dass das Beibehalten der Luminanz in dem Graustufenbild auch andere Wahrnehmungslichtmaße wie L * (wie in dem CIE Lab-Farbraum von 1976), die durch die lineare Luminanz Y bestimmt sind, enthält selbst (wie im CIE 1931 XYZ- Farbraum), den wir hier als Y linear bezeichnen werden , um jede Mehrdeutigkeit zu vermeiden.

Farbmetrische (wahrnehmungsleuchtdichte) Konvertierung in Graustufen
Eine allgemeine Strategie besteht darin, die Prinzipien der Photometrie oder allgemeiner der Farbmetrik zu verwenden, um die Graustufenwerte (im Ziel-Graustufenfarbraum) so zu berechnen, dass sie die gleiche Luminanz (technisch relative Luminanz) wie das Originalfarbbild (entsprechend seinem Farbraum) aufweisen ). Zusätzlich zu der gleichen (relativen) Leuchtdichte stellt diese Methode auch sicher, dass beide Bilder die gleiche absolute Leuchtdichte haben, wenn sie angezeigt werden, wie durch Instrumente in ihren SI-Einheiten von Candela pro Quadratmeter in jedem gegebenen Bereich des Bildes gemessen werden kann. gleiche Weißpunkte gegeben. Die Luminanz selbst wird unter Verwendung eines Standardmodells des menschlichen Sehens definiert, so dass das Beibehalten der Luminanz in dem Graustufenbild auch andere Wahrnehmungslichtmaße wie L * (wie in dem CIE Lab-Farbraum von 1976), die durch die lineare Luminanz Y selbst bestimmt sind, enthält (wie im CIE 1931 XYZ-Farbraum), den wir hier als Ylinear bezeichnen werden, um jegliche Mehrdeutigkeit zu vermeiden.

Um eine Farbe von einem Farbraum basierend auf einem typischen gammakomprimierten (nichtlinearen) RGB-Farbmodell in eine Graustufendarstellung ihrer Leuchtdichte zu konvertieren, muss die Gammakompressionsfunktion zuerst durch Gammaexpansion (Linearisierung) entfernt werden, um das Bild in ein lineares RGB zu transformieren Farbraum, so dass die entsprechende gewichtete Summe auf die linearen Farbkomponenten angewendet werden kann  ) um die lineare Luminanz Y linear zu berechnen, die dann wieder gammakomprimiert werden kann, wenn das Graustufenergebnis ebenfalls codiert und in einem typischen nichtlinearen Farbraum gespeichert werden soll.

Related Post

Für den üblichen sRGB-Farbraum ist die Gamma-Erweiterung definiert als


wobei C srgb eine der drei gamma-komprimierten sRGB-Primärfarben ( R srgb , G srgb und B srgb , jeweils im Bereich [0,1]) darstellt und C linear der entsprechende lineare Intensitätswert ist ( R linear , G linear , und B linear , ebenfalls im Bereich [0,1]).Dann wird die lineare Leuchtdichte als eine gewichtete Summe der drei linearen Intensitätswerte berechnet. Der sRGB-Farbraum ist definiert als CIE 1931lineare Luminanz Y linear , die gegeben ist durch


Diese drei speziellen Koeffizienten repräsentieren die Intensität (Luminanz) Wahrnehmung von typischen trichromat Menschen zu Licht des präzisen Rec. 709 additive Primärfarben (Chromatizitäten), die bei der Definition von sRGB verwendet werden. Das menschliche Sehen ist am empfindlichsten gegenüber Grün, so dass dieses den größten Koeffizientenwert (0,7152) und am wenigsten empfindlich gegenüber Blau aufweist, so dass dies den kleinsten Koeffizienten (0,0722) hat. Um die Graustufenintensität in linearem RGB zu kodieren, kann jede der drei Farbkomponenten so eingestellt werden, dass sie der berechneten linearen Luminanz entspricht  (ersetzt  durch die Werte  um diese lineare Graustufe zu erhalten), die dann normalerweise gammakomprimiert werden muss, um zu einer herkömmlichen nichtlinearen Darstellung zurückzukehren. Für sRGB wird dann jede ihrer drei Primärfarben auf dasselbe gammakomprimierte Y srgb gesetzt,das durch das Inverse der obigen gamma-Erweiterung gegeben ist


Da die drei sRGB-Komponenten dann gleich sind und angeben, dass es sich tatsächlich um ein graues Bild (nicht um eine Farbe) handelt, müssen diese Werte nur einmal gespeichert werden. Wir nennen dies das resultierende Graustufenbild. Dies wird normalerweise in sRGB-kompatiblen Bildformaten gespeichert, die eine einkanalige Graustufendarstellung wie JPEG oder PNG unterstützen. Web-Browser und andere Software, die sRGB-Bilder erkennen, sollten dasselbe Rendering für ein solches Graustufenbild erzeugen wie für ein „Farb“ -SRGB-Bild mit den gleichen Werten in allen drei Farbkanälen.

Luma-Codierung in Videosystemen
Für Bilder in Farbräumen wie Y’UV und seine Verwandten, die in Standard-Farbfernseh- und -videosystemen wie PAL, SECAM und NTSC verwendet werden, wird eine nichtlineare Lumakomponente (Y ‚) direkt aus gamma-komprimierten Primärintensitäten berechnet als eine gewichtete Summe, die, obwohl sie keine perfekte Darstellung der kolorimetrischen Luminanz ist, schneller berechnet werden kann, ohne die in fotometrischen / colorimetrischen Berechnungen verwendete Gammaexpansion und -kompression. In den Y’UV und Y’IQ Modellen, die von PAL und NTSC verwendet werden, wird die rec601 Luma (Y ‚) Komponente berechnet als


Wir verwenden die Primzahl, um diese nichtlinearen Werte von den sRGB nichtlinearen Werten (oben diskutiert) zu unterscheiden, die eine etwas andere Gammakompressionsformel verwenden, und von den linearen RGB-Komponenten. Der vom ATSC entwickelte HDU-Standard ITU-R BT.709 verwendet unterschiedliche Farbkoeffizienten und berechnet die Luma-Komponente als

 .
Obwohl dies die gleichen Koeffizienten sind, die oben in sRGB verwendet wurden, ist der Effekt anders, da sie hier direkt auf die Gamma-komprimierten Werte und nicht auf die linearisierten Werte angewendet werden. Der ITU-R BT.2100-Standard für HDR-Fernsehen verwendet noch andere Koeffizienten, um die Luma-Komponente zu berechnen

 .
Normalerweise werden diese Farbräume zurück in nichtlineares R’G’B ‚umgewandelt, bevor das Rendern für die Betrachtung erfolgt. In dem Maße, wie genug Präzision bleibt, können sie dann genau wiedergegeben werden.

Aber wenn die Lumakomponente Y ’selbst stattdessen direkt als Graustufendarstellung des Farbbildes verwendet wird, wird die Leuchtdichte nicht beibehalten: zwei Farben können die gleiche Leuchtdichte Y  aber unterschiedliche CIE lineare Leuchtdichte Y(und somit verschiedene nichtlineare Y srgb wie definiert haben) oben) und erscheinen daher für einen typischen Menschen dunkler oder heller als die ursprüngliche Farbe. In ähnlicher Weise haben zwei Farben mit der gleichen Leuchtdichte Y (und somit dem gleichen Y srgb ) im allgemeinen unterschiedliche Leuchtdichten durch eine der obigen Y ‚ Luma-Definitionen.

Farbbilder bestehen oft aus mehreren gestapelten Farbkanälen, von denen jeder die Werte des jeweiligen Kanals darstellt. Zum Beispiel bestehen RGB-Bilder aus drei unabhängigen Kanälen für rote, grüne und blaue Primärfarbkomponenten; CMYK-Bilder haben vier Kanäle für Cyan, Magenta, Gelb und Schwarz Tintenplatten usw.

Hier sehen Sie ein Beispiel für die Farbkanalaufteilung eines vollständigen RGB-Farbbildes. Die Spalte links zeigt die isolierten Farbkanäle in natürlichen Farben, während rechts ihre Graustufen-Äquivalenzen zu sehen sind:

Umgekehrt ist es auch möglich, aus den einzelnen Graustufenkanälen ein Vollfarbbild zu erstellen. Durch das Fehlen von Kanälen, die Verwendung von Offsets, rotierenden und anderen Manipulationen können künstlerische Effekte erzielt werden, anstatt das Originalbild exakt zu reproduzieren.

Share