YUV نظام الألوان

YUV هو نظام ترميز الألوان المستخدم عادةً كجزء من خط أنابيب الصورة الملونة. وهي تشفر صورة ملونة أو فيديو يأخذ الإدراك البشري في الحسبان ، مما يسمح بعرض النطاق الترددي المنخفض لمكونات التلون ، وبالتالي يمكن عادةً أن تمكّن أخطاء الإرسال أو القطع الفنية من أن تكون أكثر ملاءمةً من قبل الإدراك البشري بدلاً من استخدام تمثيل “RGB” “مباشر”. ترميزات الألوان الأخرى لها خصائص متشابهة ، والسبب الرئيسي لتنفيذ أو التحقق من خصائص Y′UV سيكون للتواصل مع التلفزيون الرقمي أو التناظري أو معدات التصوير التي تتوافق مع معايير Y′UV معينة.

إن نطاق مصطلحات Y′UV و YUV و YCbCr و YPbPr وما إلى ذلك ، يكون أحيانًا غامضًا ومتداخلًا. تاريخياً ، تم استخدام المصطلحين YUV و Y′UV لترميز تناظري محدد لمعلومات الألوان في أنظمة التلفزيون ، بينما تم استخدام YCbCr للتشفير الرقمي لمعلومات الألوان المناسبة للفيديو وضغط الصور الثابتة ونقلها مثل MPEG و JPEG. اليوم ، يشيع استخدام مصطلح YUV في صناعة الكمبيوتر لوصف تنسيقات الملفات التي تم ترميزها باستخدام YCbCr.

يحدد نموذج Y′UV مساحة لونية من حيث واحد luma (Y ′) ومكونان من chrominance (UV). يستخدم نموذج اللون Y′UV في فيديو لون مركب PAL (باستثناء معيار PAL-N). استخدمت أنظمة الأسود والأبيض السابقة فقط معلومات luma (Y ′). تمت إضافة معلومات اللون (U و V) بشكل منفصل عن طريق ناقل فرعي بحيث يمكن لجهاز استقبال بالأبيض والأسود أن يكون قادرًا على استلام وعرض صورة ملونة في التنسيق الأصلي بالأبيض والأسود للمستلم.

Y ′ لتقف على مكون luma (السطوع) و U و V هما مكونات التلون (اللون)؛ يتم الإشارة إلى luminance بواسطة Y و Luma بواسطة Y ′ – تشير الرموز الرئيسية (‘) إلى ضغط غاما ، مع “النصوع” تعني سطوع المساحة الخطية المادية ، بينما “luma” هي سطوع إدراكي (غير خطي).

نموذج اللون YPbPr المستخدم في فيديو مكون تمثيلي وإصداره الرقمي YCbCr المستخدم في الفيديو الرقمي مستمد من ذلك أو أكثر ويسمى أحيانًا Y′UV. (CB / PB و CR / PR هي انحرافات رمادية على محاور أزرق – أصفر وأحمر – سماوي ، في حين أن U و V هما اختلافان بين اللونين الأزرق والإضاءة والإنارة على التوالي.) فضاء اللون Y′IQ المستخدم في التلفزيون التناظري NTSC يرتبط النظام الإذاعي به ، وإن كان بطريقة أكثر تعقيدًا.كما ترتبط مساحة اللون YDbDr المستخدمة في أنظمة الإذاعة التلفزيونية التناظرية SECAM و PAL-N.

أما بالنسبة لأصل الكلمة ، فإن Y و Y ′ و U و V ليست اختصارات. يمكن إرجاع استخدام الحرف Y للإضاءة إلى اختيار الانتخابات التمهيدية XYZ. هذا يفسح المجال بشكل طبيعي لاستخدام الحرف نفسه في luma (Y ′) ، والذي يقارب ارتباط مرتبط بشكل موحد للإضاءة. وبالمثل ، تم اختيار U و V لتمييز محاور U و V عن تلك الموجودة في مساحات أخرى ، مثل مساحة x و y اللونية. راجع المعادلات أدناه أو قارن التطور التاريخي للرياضيات.

التاريخ
تم اختراع Y′UV عندما أراد المهندسون تلفازًا ملونًا في بنية أساسية باللونين الأبيض والأسود. كانوا بحاجة إلى طريقة إرسال إشارة متوافقة مع التلفزيون الأبيض والأسود (B & W) مع القدرة على إضافة اللون. يوجد بالفعل مكون luma كإشارة سوداء وبيضاء؛ أضافوا إشارة الأشعة فوق البنفسجية إلى هذا كحل.

تم اختيار تمثيل الأشعة فوق البنفسجية من التشبع عبر إشارات R و B مستقيمة لأن U و V إشارات فرق اللون. بمعنى آخر ، تشير إشارات U و V إلى أن التلفزيون يقوم بتحويل لون بكسل معين دون تغيير سطوعه. أو تشير إشارات U و V إلى أن الشاشة تجعل لونًا أكثر إشراقًا على حساب الآخر ومقدار ما يجب تحويله. كلما كانت قيم U و V أعلى (أو أقل عندما تكون سالبة) ، كلما زادت درجة التشبع (الملونة). وكلما اقتربت قيم U و V من الصفر ، كلما قلل ذلك من تغير اللون مما يعني أن الأضواء الحمراء والخضراء والزرقاء ستكون أكثر سطوعًا على حد سواء ، مما يؤدي إلى إنشاء بكسل للجرام. هذه هي فائدة استخدام إشارات فرق اللون ، بمعنى بدلاً من إخبار اللون الأحمر بالألوان ، تخبره بمقدار اللون الأحمر أكثر من الأخضر أو ​​الأزرق. ويعني هذا بدوره أنه عندما تكون إشارات U و V صفرية أو غير موجودة ، فإنها تعرض صورة ذات تدرج رمادي فقط. إذا تم استخدام R و B ، فسيكون لها قيم غير صفرية حتى في مشهد B & W ، تتطلب كل الإشارات الثلاثة التي تحمل البيانات. كان هذا أمرًا مهمًا في الأيام الأولى للتلفزيون الملون ، لأن الإشارات التلفزيونية السوداء والبيضاء القديمة لم تكن موجودة في إشارات U و V ، وهذا يعني أن التلفزيون الملون سيعرضها فقط كإخراج B & W TV خارج الصندوق. بالإضافة إلى ذلك ، يمكن للمستقبلات بالأبيض والأسود أن تأخذ إشارة Y and وتتجاهل إشارات اللونين U و V ، مما يجعل Y′UV متوافقاً مع جميع المعدات والأدوات السوداء والبيضاء الحالية والمدخلات والمخرجات. إذا لم يكن معيار التلفزيون الملون يستخدم إشارات فرق اللون ، فقد يعني ذلك أن التلفزيون الملون سيصنع ألوانًا مضحكة من بث B & W أو يحتاج إلى دارات إضافية لترجمة إشارة B & W للون. كان من الضروري تعيين عرض نطاق أضيق لقناة التضمين لأنه لم يكن هناك عرض نطاق إضافي متاح. إذا كانت بعض معلومات الإنارة قد وصلت عبر قناة التلوّن (كما لو كانت تستخدم إشارات RB بدلاً من إشارات الأشعة فوق البنفسجية التفاضلية) ، لكان قرار B & W قد تم اختراقه.

التحويل إلى / من RGB
SDTV مع BT.601
عادةً ما يتم إنشاء إشارات Y′UV من مصدر RGB (أحمر وأخضر وأزرق). يتم جمع القيم الموزونة لـ R و G و B لإنتاج Y ′ ، مقياس السطوع أو الإنارة بشكل عام. يتم حساب U و V كاختلافات متدرجة بين قيم Y ′ و B و R.

BT.601 يحدد الثوابت التالية:


يتم حساب Y′UV من RGB على النحو التالي:


النطاقات الناتجة من Y ، U ، و V على التوالي هي [0 ، 1] ، [−Umax ، Umax] ، و [−Vmax ، Vmax].

تحويل التحويل أعلاه يحول Y′UV إلى RGB:


وبالمثل ، فإن استبدال قيم الثوابت والتعبير عنها كمصفوفات يعطي هذه الصيغ لـ BT.601:


HDTV مع BT.709

وفيما يتعلق بالتلفزيون عالي الوضوح ، قررت لجنة ATSC تغيير القيم الأساسية بالنسبة إلى WR و WB مقارنة بالقيم المحددة سابقاً في نظام التلفزيون عادي الوضوح (SDTV). بالنسبة إلى HDTV ، يتم توفير هذه القيم بواسطة Rec. 709. وقد أثر هذا القرار بشكل أكبر على مصفوفة تحويل Y′UV↔RGB بحيث تختلف قيم أعضائه قليلاً. ونتيجة لذلك ، مع SDTV و HDTV هناك عموما تمثيلان متميزان Y′UV ممكن لأي ثلاثية RGB: SDTV-Y′UV و HDTV-Y′UV واحد. وهذا يعني بالتفصيل أنه عند التحويل المباشر بين SDTV و HDTV ، تكون المعلومات (Y ′) luma هي نفسها تقريبًا ، ولكن يحتاج تمثيل معلومات القناة اللونية (U & V) إلى التحويل. لا يزال في تغطية الفضاء اللون CIE 1931 ريك. مساحة اللون 709 هي متطابقة تقريبًا إلى Rec. 601 ويغطي 35.9 ٪. على النقيض من هذا UHDTV مع Rec. ٢٠٢٠ ﻳﻐﻄﻲ ﻣﺴﺎﺣﺔ أﻛﺒﺮ ﻛﺜﻴﺮًا ، ﻛﻤﺎ أﻧﻪ ﺳﻮف ﻳﺮى ﻣﺠﻤﻮﻋﺔ ﻣﺼﻔﻮﻓﺔ ﺧﺎﺻﺔ ﺑﻪ ﻟـ YUV / Y′UV.

BT.709 يحدد قيم الوزن هذه:


مصفوفات التحويل والصيغ لـ BT.709 هي:


ملاحظات
الأوزان المستخدمة لحساب Y ′ (الصف العلوي من المصفوفة) هي مماثلة لتلك المستخدمة في الفضاء اللون Y′IQ.
تساوي القيم المتساوية للأحمر والأخضر والأزرق (أي مستويات الرمادي) 0 لـ U و V. Black و RGB = (0 و 0 و 0) وتنتج YUV = (0، 0، 0). الأبيض ، RGB = (1 ، 1 ، 1) ، ينتج YUV = (1 ، 0 ، 0).
تستخدم هذه الصيغ تقليديًا في أجهزة التلفزيون والأجهزة التناظرية ؛ تستخدم المعدات الرقمية مثل HDTV وكاميرات الفيديو الرقمية Y′CbCr.

التقريب العددي
قبل تطوير معالجات النقطة العائمة SIMD السريعة ، استخدمت معظم التطبيقات الرقمية لـ RGB → Y′UV عددًا صحيحًا من الرياضيات ، وعلى وجه الخصوص التقريبات الثابتة. يقصد بالتقريب أن دقة الأرقام المستخدمة (بيانات المدخلات وبيانات المخرجات والقيم الثابتة) محدودة ، وبالتالي يتم قبول فقدان الدقة عادة حول آخر رقم ثنائي من قبل الشخص الذي يستخدم هذا الخيار في المقايضة عادةً تحسين سرعات الحساب.

في الأمثلة التالية ، المشغل ”  “يدل على التحول الصحيح للمراكز الثنائية ب. للتوضيح ، تستخدم المتغيرات حرفين لاحقين: يتم استخدام “u” للتمثيل النهائي غير الموقَّع ، ويتم استخدام “t” للقيمة الوسيطة المعيارية. يتم إعطاء الأمثلة أدناه لـ BT.601 فقط. يمكن استخدام نفس المبدأ للقيام بعمليات مكافئة وظيفياً باستخدام قيم تطابق مقبول للبيانات التي تتبع BT.709 أو أي معيار آخر مماثل.

يتم تحويل قيم Y ′ تقليديًا إلى النطاق [16 ، 235] (يُشار إليه بـ swing studio أو “مستويات التليفزيون”) بدلاً من استخدام النطاق الكامل لـ [0، 255] (يُشار إليه بـ swing كامل أو “مستويات PC “). تم توحيد هذه الممارسة في SMPTE-125M من أجل استيعاب تجاوزات الإشارة (“الرنين”) بسبب الترشيح. تستوعب القيمة 235 الحد الأقصى من الأسود إلى الأبيض بمقدار 255 – 235 = 20 ، أو 20 / (235 – 16) = 9.1٪ ، وهو أكبر قليلاً من التجاوز الحد الأقصى النظري (Gibbs) من حوالي 8.9٪ من الخطوة القصوى. تكون غرفة إصبع القدم أصغر ، مما يسمح بتجاوز 16/219 = 7.3٪ فقط ، وهو أقل من تجاوز الحد الأقصى النظري البالغ 8.9٪. لهذا السبب تم إضافة 16 إلى Y ′ ولماذا يتم جمع معاملات Y في مجموع التحويل الأساسي إلى 220 بدلاً من 255. يتم جمع قيم U و V ، والتي قد تكون موجبة أو سالبة ، مع 128 لجعلها إيجابية دائمًا ، مما يعطي يتراوح نطاق الاستوديوهات بين 16 و 240 لـ U و V. (تعتبر هذه النطاقات مهمة في تحرير الفيديو وإنتاجه ، نظرًا لأن استخدام النطاق الخاطئ سينتج إما في صورة ذات اللون الأسود أو “المقطوع” أو صورة منخفضة التباين.)

الاستوديو البديل ل BT.601
للحصول على التمثيل التقليدي “للاستديو-البديل” 8 بت لـ Y′UV لـ SDTV / BT.601 ، يمكن استخدام العمليات التالية:

1. تحويل أساسي من قيم RGB ذات 8 بت إلى قيم 16 بت (Y ′: غير الموقعة ، U / V: signed ، تم تقريب قيم المصفوفة بحيث يكون النطاق Y later المطلوب لاحقًا من [16..235] و U / V يتم الوصول إلى نطاق [16..240]):


2. خفض (“>> 8”) إلى 8 بت مع التقريب (“+128”) (Y ′: بدون توقيع ، U / V: signed):


3. إضافة إزاحة إلى القيم لإزالة أي قيم سالبة (كل النتائج غير موقعة 8 بت):


أرجوحة كاملة لـ BT.601
للحصول على تمثيل 8-bit “swing” لـ Y′UV لـ SDTV / BT.601 ، يمكن استخدام العمليات التالية:

1. التحويل الأساسي من قيم RGB ذات 8 بت إلى قيم 16 بت (Y ′: غير الموقعة ، U / V: signed ، تم تقريب قيم المصفوفة بحيث يتم الوصول إلى النطاق Y′UV المطلوب في وقت لاحق من كل [0..255] في حين لا يمكن حدوث تجاوز):


2. مقياس (“>> 8”) إلى قيم 8 بت مع التقريب (“+128”) (Y ′: بدون توقيع ، U / V: signed):


3. إضافة إزاحة إلى القيم لإزالة أي قيم سالبة (كل النتائج غير موقعة 8 بت):


نظم الإنارة / التلون بشكل عام

الميزة الأساسية لأنظمة luma / chroma مثل Y′UV ، وأقاربها Y′IQ و YDbDr ، هي أنها تظل متوافقة مع التلفزيون التناظري بالأبيض والأسود (إلى حد كبير بسبب عمل جورج Valensi). تحفظ قناة Y كل البيانات المسجلة بواسطة الكاميرات السوداء والبيضاء ، لذلك فهي تنتج إشارة مناسبة للاستقبال على شاشات أحادية اللون القديمة. في هذه الحالة ، يتم تجاهل U و V ببساطة. في حالة عرض اللون ، يتم استخدام جميع القنوات الثلاث ، ويمكن فك تشفير معلومات RGB الأصلية.

ميزة أخرى من Y′UV هو أنه يمكن تجاهل بعض المعلومات من أجل تقليل عرض النطاق الترددي. لدى العين البشرية حساسية مكانية قليلة إلى حد ما للون: إن دقة معلومات السطوع لقناة النصوع لها تأثير أكبر بكثير على تفاصيل الصورة المميزة عن تلك الموجودة في الاثنين الآخرين. من خلال فهم هذا القصور البشري ، فإن معايير مثل NTSC و PAL تقلل من عرض نطاق قنوات التلون إلى حد كبير. (النطاق الترددي في النطاق الزمني ، ولكن هذا يترجم إلى المجال المكاني كما يتم مسح الصورة.)

لذلك ، يمكن أن تكون إشارات U و V الناتجة مضغوطة بشكل كبير. في أنظمة NTSC (Y′IQ) و PAL ، كانت إشارات التضمين ذات عرض نطاق أضيق بشكل كبير عن ذلك بالنسبة للإضاءة. تتناوب الإصدارات المبكرة من NTSC بسرعة بين ألوان معينة في مناطق صورة متماثلة لجعلها تظهر مضيفًا لبعضها البعض للعين البشرية ، بينما تستخدم جميع مقاييس الفيديو التناظرية الحديثة وحتى الرقمية أكثر من الغمامة الفرعية عن طريق تسجيل معلومات لون الصورة بدقة منخفضة. يتم الاحتفاظ فقط نصف الدقة الأفقية مقارنة مع معلومات السطوع (يطلق عليها اسم 4: 2: 2) ، وغالبا ما يتم أيضا نصف القرار الرأسي (إعطاء 4: 2: 0). تم تبني المعيار 4: x: x بسبب أول لون قياسي من NTSC والذي استخدم فصلًا فرعيًا من 4: 1: 1 (حيث يتم تسوية دقة الألوان الأفقية بينما تكون الدقة العمودية كاملة) بحيث لا تحمل الصورة سوى ربع دقة اللون مقارنة بدقة السطوع. واليوم ، لا تستخدم إلا الإشارات غير المضغوطة للمعالجة المتقدمة فصلًا فرعيًا من 4: 4: 4 بدقة متساوية لكل من معلومات السطوع واللون.

تم اختيار محاور I و Q وفقًا لعرض النطاق الترددي الذي تحتاج إليه الرؤية البشرية ، حيث أن أحد المحاور هو الذي يتطلب عرض النطاق الترددي الأكبر ، والآخر (بدرجة 90 على نحو مفاجئ) هو الحد الأدنى. ومع ذلك ، كان إزالة صحيح I و Q أكثر تعقيدًا نسبيًا ، مما يتطلب خطي تأخر تمثيليًا ، ونادرًا ما تستخدمه أجهزة استقبال NTSC.

ومع ذلك ، فإن هذا التحويل في الفضاء الملون هو ضياع ، واضح بشكل خاص في الحديث المتبادل من luma إلى سلك حمل chroma ، والعكس بالعكس ، في الأجهزة التناظرية (بما في ذلك موصلات RCA لنقل إشارة رقمية ، لأن كل ما يحمله هو فيديو مركب تماثلي ، إما YUV أو YIQ أو حتى CVBS). علاوة على ذلك ، تشفر NTSC و PAL إشارات اللون بطريقة تسبب إشارات chroma و luma ذات عرض النطاق الترددي العالي للاختلاط مع بعضها البعض في محاولة للحفاظ على التوافق مع أجهزة التلفزيون بالأبيض والأسود ، مما يؤدي إلى زحف دوت والتحف الملونة المتقاطعة. عندما تم إنشاء معيار NTSC في الخمسينات ، لم يكن هذا مصدر قلق حقيقي لأن جودة الصورة كانت محدودة بواسطة جهاز المراقبة ، وليس إشارة النطاق الترددي المحدود التي يتم تلقيها. لكن تلفزيون اليوم الحديث قادر على عرض معلومات أكثر مما هو موجود في هذه الإشارات الفاشلة. لمواكبة قدرات تقنيات العرض الجديدة ، جرت محاولات منذ أواخر السبعينات للحفاظ على المزيد من إشارة Y′UV أثناء نقل الصور ، مثل SCART (1977) و S-Video (1987) الموصلات.

بدلاً من Y′UV ، تم استخدام Y′CbCr كتنسيق قياسي لوغاريتمات ضغط الفيديو الشائعة (الرقمية) مثل MPEG-2. يحافظ التلفزيون الرقمي وأقراص DVD على تدفقات الفيديو المضغوطة بتنسيق MPEG-2 ، الذي يستخدم مساحة ألوان Y′CbCr كاملة ، على الرغم من الاحتفاظ بالعمليات المحددة لفصل الألوان chroma. يستخدم تنسيق الفيديو الرقمي CCIR 601 المحترف أيضًا Y′CbCr عند معدل الاختناق الفرعي Chroma المشترك بنسبة 4: 2: 2 ، بشكل أساسي للتوافق مع معايير الفيديو التناظرية السابقة. يمكن خلط هذا التدفق بسهولة في أي تنسيق إخراج مطلوب.

Y′UV ليس مساحة لون مطلق. إنها طريقة لترميز معلومات RGB ، ويعتمد اللون الفعلي المعروض على ألوان RGB الفعلية المستخدمة لعرض الإشارة. ولذلك ، فإن القيمة المعبر عنها بـ Y′UV يمكن التنبؤ بها فقط إذا تم استخدام ألوان RGB القياسية (أي مجموعة ثابتة من اللونية الأولية ، أو مجموعة معينة من الأحمر والأخضر والأزرق).

علاوة على ذلك ، فإن نطاق الألوان و السطوع (المعروف باسم التدرج اللوني) لـ RGB (سواء كان BT.601 أو Rec.709) أصغر بكثير من نطاق الألوان و السطوع الذي تسمح به Y′UV. يمكن أن يكون هذا مهمًا جدًا عند التحويل من Y′UV (أو Y′CbCr) إلى RGB ، نظرًا لأن الصيغ أعلاه يمكن أن تنتج قيم RGB “غير صالحة” – أي قيم أقل من 0٪ أو أعلى بكثير من 100٪ من المدى (على سبيل المثال ، خارج نطاق 16-235 القياسي (و 16–240 نطاق كروما) لأجهزة التلفزيون والمحتوى عالي الوضوح ، أو خارج 0-255 للتعريف القياسي على أجهزة الكمبيوتر الشخصية. ما لم يتم التعامل مع هذه القيم ، فإنها عادة ما يتم “قصها” (أي محدودة) إلى النطاق الصالح للقناة المتأثرة. هذا يغير لون اللون ، وهو أمر غير مرغوب فيه للغاية ، لذلك غالبا ما يعتبر من الأفضل عدم تشبع الألوان المسيئة بحيث تقع داخل نطاق RGB. وبالمثل ، عندما يتم تحويل RGB عند عمق بت محدد إلى YUV عند نفس عمق البت ، يمكن أن تصبح ألوان RGB متعددة نفس اللون Y′UV ، مما يؤدي إلى فقدان المعلومات.

العلاقة مع Y′CbCr
وكثيرا ما يستخدم Y′UV كمصطلح ل YCbCr. ومع ذلك ، فهي تنسيقات مختلفة تمامًا بعوامل قياس مختلفة.

ومع ذلك ، فإن العلاقة بينهما في الحالة القياسية بسيطة. وعلى وجه الخصوص ، تكون القناة Y متماثلة في كلٍ منهما ، حيث يتناسب كل من Cb و U مع (BY) ، ويكون كل من Cr و V متناسبان مع (RY).