Двоичное изображение — HiSoUR История культуры

Двоичное изображение представляет собой цифровое изображение, которое имеет только два возможных значения для каждого пикселя. Как правило, два цвета, используемые для двоичного изображения, являются черно-белыми. Цвет, используемый для объекта (ов) на изображении, представляет собой цвет переднего плана, а остальная часть изображения — цвет фона. В индустрии сканирования документов это часто называют «би-тональным».

Двоичные изображения также называются двухуровневыми или двухуровневыми. Это означает, что каждый пиксель хранится как один бит, т. Е. 0 или 1. Названия черно-белые, черно-белые, монохромные или монохроматические часто используются для этой концепции, но могут также обозначать любые изображения, которые имеют только один образец на пиксель, например, изображения в оттенках серого. В языке Photoshop двоичное изображение совпадает с изображением в режиме «Bitmap».

Двоичные изображения часто возникают при обработке цифровых изображений в виде масок или в результате определенных операций, таких как сегментация, пороговое значение и сглаживание. Некоторые устройства ввода / вывода, такие как лазерные принтеры, факсимильные аппараты и двухуровневые компьютерные дисплеи, могут обрабатывать только двууровневые изображения.

Бинарное изображение может быть сохранено в памяти в виде растрового изображения, упакованного массива бит. Для изображения размером 640 × 480 требуется 37,5 KiB памяти. Из-за небольшого размера файлов изображений в этом формате используются решения для факса и управления документами. Большинство бинарных изображений также хорошо сжимаются с простыми схемами сжатия по длине.

Двоичные изображения можно интерпретировать как подмножества двумерной целочисленной решетки Z2; область морфологической обработки изображений во многом вдохновлялась этим взглядом.

Операции над двоичными изображениями
Весь класс операций над двоичными изображениями работает в окне 3 × 3 изображения. Это содержит девять пикселей, поэтому 512 (2 ^ 9) возможных значений. Учитывая только центральный пиксель, можно определить, остается ли он установленным или не установленным, на основе окружающих пикселей. Примерами таких операций являются истончение, расширение, поиск точек ветвления и конечных точек, удаление изолированных пикселей, смещение изображения в пиксель в любом направлении и нарушение H-соединений. Game of Life от Conway также является примером операции окна 3 × 3.

Другой класс операций основан на понятии фильтрации со структурирующим элементом. Элемент структурирования представляет собой двоичное изображение, обычно маленькое, которое передается по целевому изображению, аналогично фильтру в обработке изображений в масштабе серого. Поскольку пиксели могут иметь только два значения, морфологические операции являются эрозией (любые неустановленные пиксели в элементе структурирования заставляют пиксель отменяться) и дилатация (любые заданные пиксели внутри элемента структурирования вызывают настройку пикселя). Важными операциями являются морфологическое открытие и морфологическое закрытие, которые состоят из эрозии с последующей дилатацией и дилатацией, за которой следует эрозия, соответственно, с использованием одного и того же структурирующего элемента. Открытие имеет тенденцию увеличивать небольшие отверстия, удалять мелкие предметы и отдельные предметы. Закрытие сохраняет мелкие объекты, удаляет дыры и соединяет объекты.

Очень важной характеристикой бинарного изображения является преобразование расстояния. Это дает расстояние от каждого заданного пикселя от ближайшего неустановленного пикселя. Преобразование расстояния может быть эффективно рассчитано. Он позволяет эффективно вычислять диаграммы Вороного, где каждому пикселю в изображении присваивается ближайший из множества точек. Это также позволяет скелетонирование, которое отличается от истончения в том, что скелеты позволяют восстановить исходное изображение. Преобразование расстояния также полезно для определения центра объекта и для согласования при распознавании изображений.

В другом классе операций собираются ориентированные на ориентацию показатели. Это часто важно при распознавании изображений, где необходимо удалить ориентацию камеры. Безрисковые метрики группы связанных или окруженных пикселей включают в себя число Эйлера, периметр, площадь, компактность, площадь отверстий, минимальный радиус, максимальный радиус.

Сегментация изображения
Двоичные изображения производятся из цветных изображений путем сегментации. Сегментация — это процесс присвоения каждому пикселю исходного изображения двум или более классам. Если существует более двух классов, то обычным результатом является несколько двоичных изображений. Простейшей формой сегментации является, вероятно, метод Otsu, который назначает пиксели переднего плана или фона, основанные на интенсивности оттенков серого. Другим методом является алгоритм водораздела. Обнаружение краев также часто создает двоичное изображение с некоторыми пикселями, назначенными красными пикселями, а также является первым шагом в дальнейшей сегментации.

Скелеты
Разбавление или скелетонирование создает двоичные изображения, которые состоят из линий в пикселях. Затем точки ветвления и конечные точки могут быть извлечены, и изображение преобразуется в график. Это важно при распознавании изображений, например, при оптическом распознавании символов.

интерпретация
Интерпретация бинарного значения пикселя также зависит от устройства. Некоторые системы интерпретируют значение бита 0 как черное и 1 как белое, а другие изменяют значение значений. В стандартном интерфейсе ПК TWAIN для сканеров и цифровых камер первый аромат называется ванилью и обратным шоколадом.

Сглаживание часто используется для отображения полутоновых изображений.

Двоичные изображения захвата изображения
Оптический диск с двоичным изображением — новый датчик изображения, который напоминает традиционную фотографическую пленку. Каждый пиксель в датчике имеет двоичный ответ, давая только однобитовое квантованное измерение локальной интенсивности света.