الرمادي

في التصوير الفوتوغرافي والحوسبة والقياس اللوني ، تكون الصورة الرمادية أو الدرجات الرمادية هي الصورة التي تكون فيها قيمة كل بكسل عينة واحدة تمثل فقط كمية من الضوء ، أي أنها تحمل معلومات الكثافة فقط. تتكون الصور من هذا النوع ، والمعروفة أيضًا باللونين الأسود والأبيض أو أحادي اللون ، حصريًا من ظلال الرمادي ، متفاوتة من الأسود في أضعف شدة إلى الأبيض عند الأقوى.

تختلف الصور ذات الدرجات الرمادية عن الصور بالأبيض والأسود ذات اللونيتين اللولبية الواحدة ، والتي في صور التصوير بالكمبيوتر هي صور ذات لونين فقط ، أسود وأبيض (تسمى أيضًا صور ثنائية أو ثنائية). تحتوي صور درجات الرمادي على العديد من درجات الرمادي في الوسط.

يمكن أن تكون الصور ذات التدرج الرمادي ناتجة عن قياس شدة الضوء عند كل بيكسل وفقًا لتركيبة معينة مرجحة من الترددات (أو الأطوال الموجية) ، وفي مثل هذه الحالات تكون أحادية اللون عند تردد واحد فقط (من الناحية العملية ، نطاق ضيق من الترددات ) إلتقطت أو تلتقط. يمكن أن تكون الترددات من حيث المبدأ من أي مكان في الطيف الكهرومغناطيسي (مثل الأشعة تحت الحمراء والضوء المرئي والأشعة فوق البنفسجية وما إلى ذلك).

الصورة اللونية اللونية (أو بشكل أكثر ضوئياً) ذات تدرج الرمادي هي صورة لها ألوان ألوان رمادية محددة ، والتي تقوم بتعيين قيم العينة الرقمية المخزنة إلى القناة اللونية لفضاء الألوان القياسي ، والتي تعتمد على خصائص قياس الرؤية البشرية.

إذا كانت الصورة الملونة الأصلية لا تحتوي على فراغ ألوان محدد ، أو إذا كانت الصورة ذات التدرج الرمادي لا تهدف إلى الحصول على نفس الكثافة الوجدانية للإنسان مثل الصورة الملونة ، فلن يكون هناك تعيين فريد من مثل هذه الصورة الملونة إلى صورة تدرج رمادي.

التمثيل العددي
يتم التعبير عن كثافة البكسل ضمن نطاق معين بين الحد الأدنى والحد الأقصى والشامل. يتم تمثيل هذا النطاق بطريقة مجردة كنطاق من 0 (أو 0٪) (غياب كلي ، أسود) و 1 (أو 100٪) (التواجد الكلي ، أبيض) ، مع أي قيم كسرية بينهما. يستخدم هذا الترميز في الأوراق الأكاديمية ، ولكن هذا لا يحدد ما هو “أسود” أو “أبيض” من حيث قياس الألوان. في بعض الأحيان يتم عكس المقياس ، كما هو الحال في الطباعة حيث تشير الكثافة العددية إلى مقدار الحبر المستخدم في نصف نغمة ، مع 0٪ تمثل الورق الأبيض (بدون حبر) و 100٪ أسود خالص (حبر كامل).

في الحوسبة ، على الرغم من أنه يمكن حساب درجات الرمادي من خلال الأرقام المنطقية ، عادة ما يتم تكميل بيكسلات الصور لتخزينها كأعداد صحيحة غير موقعة ، وذلك لتقليل التخزين والحساب المطلوبين. يمكن لبعض أجهزة عرض درجات الرمادي المبكرة فقط عرض ما يصل إلى ستة عشر ظلالًا مختلفة ، والتي سيتم تخزينها في شكل ثنائي باستخدام 4 بتات. ولكن عادةً ما يتم تخزين الصور بتدرج الرمادي (مثل الصور الفوتوغرافية) المخصصة للعرض المرئي (على الشاشة والمطبوعة) باستخدام 8 بت لكل بكسل. يسمح عمق البكسل هذا بتسجيل 256 كثافة مختلفة (أي ظلال الرمادي) ، كما يسهل عملية الحوسبة حيث يمكن الوصول إلى كل عينة بكسل بشكل فردي ك بايت واحد كامل. ومع ذلك ، إذا كانت هذه الكثافات متساوية بالتساوي مع مقدار الضوء المادي الذي تمثله عند هذا البكسل (المسمى بتشفير أو مقياس خطي) ، فإن الاختلافات بين الظلال الداكنة المجاورة يمكن أن تكون ملحوظة تمامًا مثل القطع المتداخلة ، في حين أن العديد من الظلال الفاتحة سيتم “إهدارها” بتشفير الكثير من الزيادات التي لا يمكن تمييزها بشكل ملحوظ. لذلك ، فإن الظلال عادة ما تكون موزعة بالتساوي على مقياس غير خطي مضغوط غاما ، والذي يقترب بشكل أفضل من الزيادات الإدراكية الموحدة لكل من الظلال الداكنة والخفيفة ، وعادة ما يجعل هذه الظلال 256 كافية (بالكاد) لتجنب الزيادات الملحوظة.

غالباً ما تتطلب الاستخدامات التقنية (على سبيل المثال في التصوير الطبي أو تطبيقات الاستشعار عن بعد) المزيد من المستويات ، للاستفادة الكاملة من دقة المستشعر (عادة 10 أو 12 بت لكل عينة) وللحد من أخطاء التقريب في الحسابات. غالباً ما يكون ستة عشر بت لكل عينة (65،536 مستوى) خيارًا مناسبًا لمثل هذه الاستخدامات ، حيث تقوم أجهزة الكمبيوتر بإدارة الكلمات ذات 16 بت بكفاءة. يدعم تنسيقات ملفات الصور TIFF و PNG (من بين غيرها) تدرج الرمادي 16 بت أصلاً ، على الرغم من أن المتصفحات والعديد من برامج التصوير تميل إلى تجاهل 8 بتات من كل بكسل ذات الترتيب المنخفض. داخليًا للحوسبة وتخزين العمل ، عادةً ما يستخدم برنامج معالجة الصور أعدادًا صحيحة أو عائمة بحجم 16 أو 32 بت.

تحويل اللون إلى درجات الرمادي
لا يعد تحويل صورة ملونة عشوائية إلى تدرج رمادي أمرًا فريدًا بشكل عام ؛ ويمثل ترجيح قنوات الألوان بشكل فعال تأثير تصوير الأفلام بالأبيض والأسود مع فلاتر فوتوغرافية مختلفة الألوان على الكاميرات.

تحويل ألوان (إدراكي إدراكي إدراكي) إلى درجات الرمادي

تتمثل إحدى الإستراتيجيات الشائعة في استخدام مبادئ القياس الضوئي أو قياس الألوان على نطاق أوسع في حساب قيم درجات الرمادي (في فراغ ألوان التدرج الهدف) وذلك للحصول على نفس النصوع (نصوع نسبي تقني) كصورة ملونة أصلية (وفقًا لطبقة ألوانه) . بالإضافة إلى نفس النصوع (النسبي) ، تضمن هذه الطريقة أيضًا أن يكون لكل صور نفس النصوع المطلق عند عرضها ، كما يمكن قياسها بأدوات في SIunits من candelas لكل متر مربع ، في أي منطقة معينة من الصورة ، معطى نقاط بيضاء متساوية. يتم تعريف النصوع نفسه باستخدام نموذج قياسي للرؤية البشرية ، لذا فإن الحفاظ على النصوع في الصورة الرمادية يحافظ أيضًا على معايير الخفة الإدراكية الحسية الأخرى ، مثل L * (كما في 1976 CIE Lفضاء اللون) الذي يحدده النصوع الخطي Y نفسها (كما هو الحال في الفضاء اللون CIE 1931 XYZ ) التي سنشير إليها هنا باسم Y خطي لتجنب أي غموض.

تحويل ألوان (إدراكي إدراكي إدراكي) إلى درجات الرمادي
تتمثل إحدى الإستراتيجيات الشائعة في استخدام مبادئ القياس الضوئي أو قياس الألوان على نطاق أوسع لحساب القيم الرمادية (في نطاق الألوان الرمادية الهدف) وذلك للحصول على نفس النصوع (نصوع نسبي تقني) كصورة ملونة أصلية (وفقًا لطبقة ألوانه) ). بالإضافة إلى نفس النصوع (النسبي) ، تضمن هذه الطريقة أيضًا أن يكون لكل من الصور نفس النصوع المطلق عند عرضها ، كما يمكن قياسها بأدوات في وحدات SI الخاصة بها من الشموع لكل متر مربع ، في أي منطقة معينة من الصورة ، معطى نقاط بيضاء متساوية. يتم تعريف الإنارة بحد ذاتها باستخدام نموذج قياسي للرؤية البشرية ، لذا فإن الحفاظ على النصوع في صورة تدرج الرمادي يحافظ أيضًا على معايير الخفة الإدراكية الحسية الأخرى ، مثل L * (كما هو الحال في فضاء ألوان مختبر CIE لعام 1976) والذي يحدده النصوع L الخطية Y نفسها (كما هو الحال في الفضاء اللون CIE 1931 XYZ) التي سنشير إليها هنا باسم Ylinear لتجنب أي غموض.

لتحويل لون من فراغ ألوان استنادًا إلى نموذج ألوان RGB مضغوط غاما (غير خطي) نموذجي إلى تمثيل تدرج الرمادي لإشعاره ، يجب أولاً إزالة وظيفة ضغط جاما عبر توسع جاما (خطي) لتحويل الصورة إلى RGB خطي colorpace ، بحيث يمكن تطبيق المجموع المرجح المناسب لمكونات اللون الخطي  ) لحساب خطي L النصري الطولي ، والذي يمكن بعد ذلك ضغطه مرة أخرى إذا كانت النتيجة الرمادية هي أيضًا أن يتم ترميزها وتخزينها في مساحة ألوان غير خطية نموذجية.

بالنسبة لمساحة اللون sRGB الشائعة ، يتم تعريف توسع gamma كـ


حيث يمثل c srgb أي من الانتخابات التمهيدية sRGB الثلاثة المضغوطة بضغط جاما ( R srgb و G srgb و B srgb ، كل منها في النطاق [0،1]) و C الخطية هي قيمة الخطية المطابقة المقابلة ( R الخطي ، G الخطي ، و B الخطية ، أيضًا في النطاق [0،1]). بعد ذلك ، يتم حساب النصوع الخطي كمجموع مرجح لقيم الشدة الخطية الثلاثة. يتم تعريف مساحة اللون sRGB من حيث الخطية CIE 1931 الخطية L ، والتي تعطى بواسطة


وتمثل هذه المعاملات الثلاثة الخاصة إدراك الشدة (الإنارة) لدى البشر المصابين بالتراكرومات النموذجية إلى ضوء درجة الدقة الدقيقة. 709 الألوان الأساسية المضافة (اللونيات) المستخدمة في تعريف sRGB. الرؤية البشرية هي الأكثر حساسية للأخضر ، لذلك هذا لديه أكبر قيمة معامل (0.7152) ، وأقل حساسية للأزرق ، لذلك هذا لديه أصغر معامل (0.0722). لتشفير شدة تدرج الرمادي في RGB الخطي ، يمكن ضبط كل مكون من مكونات الألوان الثلاثة ليعادل النصوع الخطي المحسوب  (استبدال  من القيم  للحصول على تدرج الرمادي الخطي) ، الذي عادةً ما يحتاج إلى ضغط غاما للرجوع إلى تمثيل تقليدي غير خطي. بالنسبة لـ sRGB ، يتم بعد ذلك تعيين كل من الانتخابات التمهيدية الثلاثة على نفس الـ Y srgb المضغوطة بضغط جاما المعطى بواسطة معكوس توسع غاما أعلاه


لأن مكونات sRGB الثلاثة متساوية بعد ذلك ، مشيرة إلى أنها في الواقع صورة رمادية (ليس لون) ، من الضروري تخزين هذه القيم مرة واحدة فقط ، ونحن نسميها الصورة الرمادية الناتجة. هذه هي الطريقة التي يتم بها تخزينها بشكل طبيعي في تنسيقات الصور المتوافقة مع sRGB التي تدعم تمثيلًا ذا درجات رمادية أحادية القناة ، مثل JPEG أو PNG. يجب أن تؤدي متصفحات الويب والبرامج الأخرى التي تتعرف على صور sRGB إلى تقديم نفس الصورة للصور الرمادية كما هو الحال بالنسبة لصورة sRGB “ملونة” لها نفس القيم في كل قنوات الألوان الثلاثة.

الترميز لوما في أنظمة الفيديو
بالنسبة للصور في المساحات اللونية مثل Y’UV وأقاربه ، والتي تستخدم في أنظمة التلفزيون والفيديو القياسية مثل PAL و SECAM و NTSC ، يتم حساب مكون luma غير خطي (Y ‘) مباشرة من شدة الضغط الأولية في جاما كمجموع وزن ، والذي ، على الرغم من أنه ليس تمثيلاً مثالياً للخصائص اللونية ، يمكن حسابه بسرعة أكبر بدون توسيع غاما والضغط المستخدم في الحسابات الضوئية / اللونية. في نماذج Y’UV و Y’Q المستخدمة من قبل PAL و NTSC ، يتم حساب مكون lucha (Y ‘) rec601


حيث نستخدم البرايم لتمييز هذه القيم غير الخطية من قيم sRGB غير الخطية (التي نوقشت أعلاه) والتي تستخدم صيغة ضغط غاما مختلفة نوعًا ما ، ومن مكونات RGB الخطية.يستخدم المعيار ITU-R BT.709 للتلفزيون عالي الوضوح الذي طورته ATSC معاملات ألوان مختلفة ، حيث يحسب مكون luma

 .
على الرغم من أن هذه معاملات نفسية تستخدم في sRGB أعلاه ، إلا أن التأثير مختلف لأنه هنا يتم تطبيقه مباشرة على قيم مضغوطة بأحجام غاما بدلاً من القيم الخطية. يستخدم المعيار ITU-R BT.2100 لتلفزيون HDR معاملات مختلفة ومع ذلك يحسب مكون luma كما يلي

 .
عادة يتم تحويل هذه الألوان إلى R’G’B غير الخطية قبل التقديم للعرض. وبقدر ما تبقى من الدقة ، يمكن تقديمها بدقة.

ولكن إذا تم استخدام مكوّن L ‘Y في حد ذاته بشكل مباشر كتصنيف بتدرج الرمادي للصورة الملونة ، فلن يتم الحفاظ على النصوع: يمكن أن يكون لونان نفس Luma Y’ لكنLYYUNI CIE L ( Y ) مختلفًا (وبالتالي ، يختلف Y srgb مختلف غير خطي كما هو محدد أعلاه) وبالتالي تظهر أغمق أو أخف بالنسبة إلى الإنسان العادي من اللون الأصلي.وبالمثل ، فإن لونين لهما نفس النصوع Y (وبالتالي نفس Y srgb ) سيكون لهما بشكل عام مجموعة مختلفة من تعاريف Y ‘ luma أعلاه.

غالبًا ما يتم إنشاء صور ملونة من عدة قنوات ألوان مكدسة ، كل منها يمثل مستويات قيمة للقناة المحددة. على سبيل المثال ، تتكون صور RGB من ثلاث قنوات مستقلة لمكونات اللون الأساسي الأحمر والأخضر والأزرق ؛ تحتوي صور CMYK على أربع قنوات لألواح الحبر السماوي والأرجواني والأصفر والأسود ، إلخ.

في ما يلي مثال على تقسيم قناة اللون لصورة ملونة كاملة RGB. يعرض العمود في اليسار قنوات الألوان المعزولة بالألوان الطبيعية ، بينما توجد على اليمين تقابلات رمادية:

العكس هو ممكن أيضا: لبناء صورة ملونة كاملة من القنوات الرمادية منفصلة. من خلال تهذيب القنوات ، باستخدام الإزاحات والتناوب والتلاعبات الأخرى ، يمكن تحقيق التأثيرات الفنية بدلاً من إعادة إنتاج الصورة الأصلية بدقة.