YUV-Farbsystem

YUV ist ein Farbkodierungssystem, das typischerweise als Teil einer Farbbild-Pipeline verwendet wird. Sie codiert ein Farbbild oder ein Video, das die menschliche Wahrnehmung berücksichtigt, wodurch eine verringerte Bandbreite für Chrominanzkomponenten ermöglicht wird, wodurch Übertragungsfehler oder Kompressionsartefakte typischerweise effizienter durch die menschliche Wahrnehmung maskiert werden können als bei Verwendung einer „direkten“ RGB-Darstellung. Andere Farbcodierungen haben ähnliche Eigenschaften, und der Hauptgrund, Eigenschaften von Y’UV zu implementieren oder zu untersuchen, wäre eine Schnittstelle mit analogem oder digitalem Fernsehen oder Fotoausrüstung, die bestimmten Y’UV-Standards entspricht.

Der Umfang der Begriffe Y’UV, YUV, YCbCr, YPbPr usw. ist manchmal mehrdeutig und überlappend. Historisch wurden die Begriffe YUV und Y’UV für eine spezifische analoge Kodierung von Farbinformation in Fernsehsystemen verwendet, während YCbCr für die digitale Kodierung von Farbinformation verwendet wurde, die für Video- und Standbildkompression und -übertragung wie MPEG und JPEG geeignet ist. Heutzutage wird der Begriff YUV häufig in der Computerindustrie verwendet, um Dateiformate zu beschreiben, die mit YCbCr codiert sind.

Das Y’UV-Modell definiert einen Farbraum in Form einer Luma (Y ‚) – und zwei Chrominanz (UV) -Komponenten. Das Y’UV-Farbmodell wird in dem PAL-Composite-Farbvideostandard (ausgenommen PAL-N) verwendet. Frühere Schwarz-Weiß-Systeme verwendeten nur Luma (Y ‚) Information. Farbinformationen (U und V) wurden separat über einen Unterträger hinzugefügt, so dass ein Schwarz-Weiß-Empfänger immer noch in der Lage wäre, eine Farbbildübertragung im nativen Schwarz-Weiß-Format des Empfängers zu empfangen und anzuzeigen.

Y ’steht für die Luminanzkomponente (die Helligkeit) und U und V sind die Chrominanz- (Farb) komponenten; Luminanz wird mit Y und Luma mit Y ‚bezeichnet – die Hauptsymbole (‚) bezeichnen Gammakompression, wobei „Luminanz“ physikalische Helligkeit des linearen Raums bedeutet, während „Luma“ (nichtlineare) wahrnehmbare Helligkeit ist.

Das YPbPr-Farbmodell, das in analogen Komponentenvideos verwendet wird, und seine digitale Version YCbCr, die in digitalen Videos verwendet wird, sind mehr oder weniger davon abgeleitet und werden manchmal Y’UV genannt. (CB / PB und CR / PR sind Abweichungen von Grau auf Blau-Gelb- und Rot-Cyan-Achsen, wohingegen U und V Blau-Luminanz- bzw. Rot-Luminanz-Differenzen sind.) Der Y’IQ-Farbraum, der in dem analogen NTSC-Fernsehgerät verwendet wird Rundfunksystem ist damit verbunden, wenn auch auf eine komplexere Art und Weise. Der YDbDr-Farbraum, der in den analogen SECAM- und PAL-N-Fernsehübertragungssystemen verwendet wird, ist ebenfalls verwandt.

Was die Etymologie betrifft, sind Y, Y ‚, U und V keine Abkürzungen. Die Verwendung des Buchstaben Y für die Leuchtdichte kann auf die Wahl von XYZ-Primärfarben zurückgeführt werden. Dies bietet sich natürlich für die Verwendung des gleichen Buchstabens in Luma (Y ‚) an, was einem wahrnehmbar gleichförmigen Korrelat der Luminanz entspricht. In ähnlicher Weise wurden U und V gewählt, um die U- und V-Achsen von denen in anderen Räumen, wie dem x- und y-Farbraum, zu unterscheiden. Siehe die folgenden Gleichungen oder vergleiche die historische Entwicklung der Mathematik.

Geschichte
Y’UV wurde erfunden, als Ingenieure Farbfernsehen in einer Schwarz-Weiß-Infrastruktur wollten. Sie benötigten eine Signalübertragungsmethode, die mit Schwarz-Weiß-TV kompatibel war und gleichzeitig Farbe hinzufügen konnte. Die Luma-Komponente existierte bereits als das Schwarz-Weiß-Signal; sie fügten das UV-Signal dazu als eine Lösung hinzu.

Die UV-Darstellung der Chrominanz wurde gegenüber den geraden R- und B-Signalen gewählt, da U und V Farbdifferenzsignale sind. Mit anderen Worten, die U- und V-Signale weisen das Fernsehgerät an, die Farbe eines bestimmten Pixels zu verschieben, ohne seine Helligkeit zu ändern. Oder die U- und V-Signale sagen dem Monitor, dass eine Farbe auf Kosten der anderen heller wird und um wie viel sie verschoben werden sollte. Je höher (oder niedriger, wenn negativ) die U- und V-Werte sind, desto gesättigter (farbiger) wird das Pixel. Je näher die U- und V-Werte an Null kommen, desto weniger verschiebt sich die Farbe, was bedeutet, dass die roten, grünen und blauen Lichter gleich heller sind und ein graueres Pixel erzeugen. Dies ist der Vorteil der Verwendung von Farbdifferenzsignalen, dh, anstatt zu sagen, wie viel Rot zu einer Farbe gehört, zeigt es an, wie viel mehr Rot als Grün oder Blau ist. Dies bedeutete wiederum, dass, wenn die U- und V-Signale Null oder nicht vorhanden wären, nur ein Graustufenbild angezeigt würde. Wenn R und B verwendet worden wären, würden diese selbst in einer Schwarzweiß-Szene Werte ungleich Null haben, die alle drei Daten übertragenden Signale erfordern. Dies war in den Anfängen des Farbfernsehens wichtig, da bei alten Schwarz-Weiß-Fernsehsignalen keine U- und V-Signale vorhanden waren, was bedeutet, dass der Farbfernsehapparat es einfach als B & W-TV aus der Box heraus darstellen würde. Zusätzlich könnten Schwarz-Weiß-Empfänger das Y-Signal nehmen und die U- und V-Farbsignale ignorieren, wodurch Y’UV rückwärtskompatibel mit allen existierenden Schwarz-Weiß-Geräten, Eingang und Ausgang, wird. Wenn der Farbfernsehstandard keine Farbdifferenzsignale verwendet hätte, könnte dies bedeuten, dass ein Farbfernseher lustige Farben aus einer Schwarzweißsendung erzeugt oder eine zusätzliche Schaltung benötigt, um das Schwarzweißsignal in Farbe umzuwandeln. Es war notwendig, dem Chrominanzkanal eine schmalere Bandbreite zuzuweisen, da keine zusätzliche Bandbreite zur Verfügung stand. Wenn einige der Luminanzinformationen über den Chrominanzkanal eintraten (wie es der Fall wäre, wenn RB-Signale anstelle von differentiellen UV-Signalen verwendet würden), wäre die B & W-Auflösung beeinträchtigt worden.

Konvertierung zu / von RGB
SDTV mit BT.601
Y’UV-Signale werden normalerweise aus der RGB-Quelle (rot, grün und blau) erzeugt. Gewichtete Werte von R, G und B werden summiert, um Y ‚, ein Maß für die Gesamthelligkeit oder -helligkeit, zu erzeugen. U und V werden als skalierte Differenzen zwischen Y ‚und den B- und R-Werten berechnet.

BT.601 definiert die folgenden Konstanten:


Y’UV wird wie folgt aus RGB berechnet:


Die resultierenden Bereiche von Y ‚, U bzw. V sind [0, 1], [-Umax, Umax] und [-Vmax, Vmax].

Durch Invertieren der obigen Transformation wird Y’UV in RGB umgewandelt:


Gleichermaßen gibt das Ersetzen von Werten für die Konstanten und das Ausdrücken dieser als Matrizen diese Formeln für BT.601:


HDTV mit BT.709

Für HDTV entschied sich der ATSC, die Grundwerte für WR und WB im Vergleich zu den zuvor ausgewählten Werten im SDTV-System zu ändern. Für HDTV werden diese Werte von Rec zur Verfügung gestellt. 709. Diese Entscheidung beeinflusste die Matrix für die Umwandlung Y’UV↔RGB weiter, so dass ihre Mitgliederwerte auch leicht unterschiedlich sind. Als Ergebnis sind bei SDTV und HDTV im Allgemeinen zwei verschiedene Y’UV-Darstellungen für jedes RGB-Tripel möglich: ein SDTV-Y’UV und ein HDTV-Y’UV. Dies bedeutet im Detail, dass, wenn direkt zwischen SDTV und HDTV konvertiert wird, die Luma (Y ‚) Information ungefähr gleich ist, aber die Darstellung der Chroma (U & V) Kanalinformation eine Umwandlung benötigt. Immer noch in der Abdeckung des CIE 1931 Farbraums ist die Rec. 709 Farbraum ist fast identisch mit Rec. 601 und umfasst 35,9%. Im Gegensatz zu diesem UHDTV mit Rec. 2020 umfasst ein viel größeres Gebiet und würde darüber hinaus seine eigene Matrix für YUV / Y’UV sehen.

BT.709 definiert diese Gewichtswerte:


Die Umrechnungsmatrizen und Formeln für BT.709 lauten wie folgt:


Anmerkungen
Die Gewichte, die zur Berechnung von Y ‚(obere Reihe der Matrix) verwendet werden, sind identisch mit denen, die im Y’IQ-Farbraum verwendet werden.
Gleiche Werte von Rot, Grün und Blau (dh Graustufen) ergeben 0 für U und V. Schwarz, RGB = (0, 0, 0) ergibt YUV = (0, 0, 0). Weiß, RGB = (1, 1, 1) ergibt YUV = (1, 0, 0).
Diese Formeln werden traditionell in analogen Fernsehgeräten und Geräten verwendet; Digitale Geräte wie HDTV und digitale Videokameras verwenden Y’CbCr.

Numerische Näherungen
Vor der Entwicklung von schnellen SIMD-Fließkommaprozessoren verwendeten die meisten digitalen Implementierungen von RGB → Y’UV ganzzahlige Mathematik, insbesondere Festkomma-Approximationen. Approximation bedeutet, dass die Genauigkeit der verwendeten Zahlen (Eingabedaten, Ausgabedaten und Konstantenwerte) begrenzt ist, und somit ein Präzisionsverlust von typischerweise etwa der letzten Binärziffer akzeptiert wird, indem derjenige, der diese Option verwendet, in der Regel einen Kompromiss einschlägt verbesserte Berechnungsgeschwindigkeiten.

In den folgenden Beispielen hat der Betreiber “  „Bezeichnet eine Rechtsverschiebung von a nach b-Binärpositionen. Zur Verdeutlichung verwenden die Variablen zwei Suffixzeichen: „u“ wird für die vorzeichenlose Enddarstellung verwendet, und „t“ wird für den herunterskalierten Zwischenwert verwendet. Die folgenden Beispiele gelten nur für BT.601. Dasselbe Prinzip kann verwendet werden, um funktionell äquivalente Operationen unter Verwendung von Werten durchzuführen, die eine akzeptable Übereinstimmung für Daten aufweisen, die dem BT.709 oder irgendeinem anderen vergleichbaren Standard folgen.

Y‘-Werte werden herkömmlicherweise verschoben und skaliert auf den Bereich [16, 235] (bezeichnet als „Studio Swing“ oder „TV-Level“), anstatt den vollen Bereich von [0, 255] (bezeichnet als Full Swing oder „PC Level“) zu verwenden „). Diese Vorgehensweise wurde in SMPTE-125M standardisiert, um Signalüberschwingungen („Ringing“) aufgrund von Filterung zu berücksichtigen. Der Wert 235 berücksichtigt ein maximales Schwarz-zu-Weiß-Überschwingen von 255 – 235 = 20 oder 20 / (235 – 16) = 9,1%, was geringfügig größer ist als das theoretische maximale Überschwingen (Gibbs-Phänomen) von etwa 8,9% des maximaler Schritt. Der Toe-Room ist kleiner und erlaubt nur 16/219 = 7,3% Überschwingen, was weniger ist als das theoretische maximale Überschwingen von 8,9%. Deshalb addiert man 16 zu Y ‚und warum die Y‘-Koeffizienten in der Basistransformation 220 statt 255 ergeben. U- und V-Werte, die positiv oder negativ sein können, werden mit 128 summiert, um sie immer positiv zu machen Studiobereich von 16-240 für U und V. (Diese Bereiche sind wichtig für die Videobearbeitung und -produktion, da die Verwendung des falschen Bereichs entweder zu einem Bild mit „abgeschnittenen“ Schwarz- und Weißbildern oder zu einem kontrastarmen Bild führt.)

Studio Schaukel für BT.601
Um die traditionelle „Studio-Swing“ 8-Bit-Darstellung von Y’UV für SDTV / BT.601 zu erhalten, können die folgenden Operationen verwendet werden:

1. Grundlegende Transformation von 8-Bit-RGB zu 16-Bit-Werten (Y ‚: vorzeichenlos, U / V: vorzeichenbehaftet, Matrixwerte wurden gerundet, so dass später der gewünschte Y‘-Bereich von [16..235] und U / V Bereich von [16..240] ist erreicht):


2. Verkleinere („>> 8“) auf 8 Bits mit Rundung („+128“) (Y ‚: vorzeichenlos, U / V: signiert):


3. Fügen Sie den Werten einen Offset hinzu, um negative Werte zu eliminieren (alle Ergebnisse sind 8-Bit vorzeichenlos):


Voller Schwung für BT.601
Um eine „volle“ 8-Bit-Repräsentation von Y’UV für SDTV / BT.601 zu erhalten, können die folgenden Operationen verwendet werden:

1. Grundlegende Transformation von 8-Bit-RGB- zu 16-Bit-Werten (Y ‚: vorzeichenlos, U / V: vorzeichenbehaftet, Matrixwerte wurden gerundet, so dass der später gewünschte Y’UV-Bereich von jedem [0..255] erreicht wird während kein Überlauf passieren kann):


2. Verkleinern („>> 8“) auf 8-Bit-Werte mit Rundung („+128“) (Y ‚: vorzeichenlos, U / V: signiert):


3. Fügen Sie den Werten einen Offset hinzu, um negative Werte zu eliminieren (alle Ergebnisse sind 8-Bit vorzeichenlos):


Luminanz / Chrominanz-Systeme im Allgemeinen

Der Hauptvorteil von Luma / Chroma-Systemen wie Y’UV und seinen Verwandten Y’IQ und YDbDr besteht darin, dass sie mit Schwarz-Weiß-Analogfernsehen kompatibel bleiben (hauptsächlich aufgrund der Arbeit von Georges Valensi). Der Y‘-Kanal speichert alle Daten, die von Schwarz-Weiß-Kameras aufgezeichnet werden, so dass ein Signal erzeugt wird, das für den Empfang auf alten Monochrom-Displays geeignet ist. In diesem Fall werden U und V einfach verworfen. Wenn die Farbe angezeigt wird, werden alle drei Kanäle verwendet und die ursprünglichen RGB-Informationen können decodiert werden.

Ein weiterer Vorteil von Y’UV ist, dass ein Teil der Information verworfen werden kann, um die Bandbreite zu reduzieren. Das menschliche Auge hat eine relativ geringe räumliche Empfindlichkeit gegenüber Farben: Die Genauigkeit der Helligkeitsinformation des Luminanzkanals hat einen viel größeren Einfluss auf die wahrgenommenen Bilddetails als die der beiden anderen. Um diesen menschlichen Mangel zu verstehen, reduzieren Standards wie NTSC und PAL die Bandbreite der Chrominanzkanäle beträchtlich. (Bandbreite ist in der temporalen Domäne, aber dies wird in die räumliche Domäne übersetzt, wenn das Bild gescannt wird.)

Daher können die resultierenden U- und V-Signale im Wesentlichen „komprimiert“ werden. In den NTSC (Y’IQ) – und PAL-Systemen hatten die Chrominanzsignale eine wesentlich geringere Bandbreite als die für die Luminanz. Frühe Versionen von NTSC wechselten schnell zwischen bestimmten Farben in identischen Bildbereichen, um sie für das menschliche Auge summierend erscheinen zu lassen, während alle modernen analogen und sogar die meisten digitalen Videostandards Chroma-Subsampling verwenden, indem sie die Farbinformation eines Bildes mit reduzierter Auflösung aufzeichnen. Nur die Hälfte der horizontalen Auflösung im Vergleich zur Helligkeitsinformation wird beibehalten (4: 2: 2 Chroma-Subsampling genannt), und oft wird auch die vertikale Auflösung halbiert (4: 2: 0). Der 4: x: x-Standard wurde aufgrund des allerersten Farb-NTSC-Standards angenommen, der ein Chroma-Subsampling von 4: 1: 1 verwendete (wobei die horizontale Farbauflösung geviertelt ist, während die vertikale Vollauflösung ist), so dass das Bild nur a viertel so viel Farbauflösung im Vergleich zur Helligkeitsauflösung. Nur High-End-Geräte, die unkomprimierte Signale verarbeiten, verwenden heute ein Chroma-Subsampling von 4: 4: 4 mit identischer Auflösung für Helligkeits- und Farbinformationen.

Die I- und Q-Achsen wurden entsprechend der Bandbreite ausgewählt, die für das menschliche Sehen erforderlich ist, wobei eine Achse diejenige ist, die die meiste Bandbreite benötigt, und die andere (zufällig bei 90 Grad) das Minimum. Die echte I- und Q-Demodulation war jedoch relativ komplexer und erforderte zwei analoge Verzögerungsleitungen, und NTSC-Empfänger verwendeten diese nur selten.

Diese Farbraumumwandlung ist jedoch verlustbehaftet, insbesondere beim Übersprechen von der Luma auf die chromatrahierende Leitung und umgekehrt in analoger Ausrüstung (einschließlich RCA-Verbindern zum Übertragen eines digitalen Signals, da sie lediglich analoge zusammengesetzte Videosignale tragen) ist entweder YUV, YIQ oder sogar CVBS). Darüber hinaus codierten NTSC- und PAL-Farbsignale in einer Weise, die Chroma- und Luma-Signale mit hoher Bandbreite dazu veranlasst, sich miteinander zu vermischen, um eine Abwärtskompatibilität mit Schwarz-Weiß-Fernsehgeräten aufrechtzuerhalten, was zu Punkt-Crawl- und Kreuz-Farbartefakten führt. Als der NTSC-Standard in den 1950er Jahren geschaffen wurde, war dies kein wirkliches Problem, da die Qualität des Bildes durch die Monitorausrüstung begrenzt war, und nicht das Signal mit begrenzter Bandbreite, das empfangen wurde. Das moderne Fernsehen von heute ist jedoch in der Lage, mehr Informationen anzuzeigen als in diesen verlustreichen Signalen enthalten ist. Um mit den Fähigkeiten neuer Anzeigetechnologien Schritt zu halten, wurden seit den späten 1970er Jahren Versuche unternommen, bei der Übertragung von Bildern, wie SCART (1977) und S-Video (1987), mehr von dem Y’UV-Signal zu erhalten.

Anstelle von Y’UV wurde Y’CbCr als Standardformat für (digitale) allgemeine Videokompressionsalgorithmen wie MPEG-2 verwendet. Digitales Fernsehen und DVDs bewahren ihre komprimierten Videoströme im MPEG-2-Format, das einen vollen Y’CbCr-Farbraum verwendet, obwohl das etablierte Verfahren des Chroma-Unterabtastens beibehalten wird. Das professionelle digitale CCIR 601-Videoformat verwendet Y’CbCr ebenfalls mit der üblichen Chroma-Unterabtastrate von 4: 2: 2, hauptsächlich für die Kompatibilität mit früheren analogen Videostandards. Dieser Stream kann problemlos in jedes gewünschte Ausgabeformat gemischt werden.

Y’UV ist kein absoluter Farbraum. Es ist eine Möglichkeit, RGB-Informationen zu kodieren, und die tatsächlich angezeigte Farbe hängt von den tatsächlichen RGB-Farbstoffen ab, die zur Anzeige des Signals verwendet werden. Daher ist ein Wert, der als Y’UV ausgedrückt wird, nur vorhersagbar, wenn Standard-RGB-Farbmittel verwendet werden (dh ein fester Satz von primären Farbarten oder ein bestimmter Satz von Rot, Grün und Blau).

Darüber hinaus ist der Bereich von Farben und Helligkeiten (bekannt als der Farbumfang) von RGB (ob es BT.601 oder Rec.709 ist) viel kleiner als der Bereich von Farben und Helligkeiten, die durch Y’UV erlaubt sind. Dies kann sehr wichtig sein, wenn von Y’UV (oder Y’CbCr) in RGB konvertiert wird, da die obigen Formeln „ungültige“ RGB-Werte erzeugen können – dh Werte unter 0% oder sehr weit über 100% des Bereichs (z. B. außerhalb der Standard 16-235 Luma-Bereich (und 16-240 Chroma-Bereich) für Fernseher und HD-Inhalte oder außerhalb 0-255 für Standard-Definition auf PCs). Wenn diese Werte nicht behandelt werden, werden sie normalerweise auf den gültigen Bereich des betroffenen Kanals „abgeschnitten“ (dh begrenzt). Dies ändert den Farbton der Farbe, was sehr unerwünscht ist, so dass es oft als besser angesehen wird, die störenden Farben so zu entsättigen, dass sie in den RGB-Farbumfang fallen. Wenn RGB bei einer gegebenen Bittiefe bei gleicher Bittiefe in YUV konvertiert wird, können gleichfalls mehrere RGB-Farben die gleiche Y’UV-Farbe annehmen, was zu einem Informationsverlust führt.

Beziehung mit Y’CbCr
Y’UV wird oft als Bezeichnung für YCbCr verwendet. Sie sind jedoch völlig unterschiedliche Formate mit unterschiedlichen Skalierungsfaktoren.

Dennoch ist die Beziehung zwischen ihnen im Standardfall einfach. Insbesondere ist der Y-Kanal in beiden gleich, sowohl Cb als auch U sind proportional zu (BY) und sowohl Cr als auch V sind proportional zu (RY).