Imagem binária

Uma imagem binária é uma imagem digital que possui apenas dois valores possíveis para cada pixel. Normalmente, as duas cores usadas para uma imagem binária são preto e branco. A cor usada para o (s) objeto (s) na imagem é a cor do primeiro plano, enquanto o restante da imagem é a cor do plano de fundo. Na indústria de digitalização de documentos, isso é muitas vezes referido como “bi-tonal”.

Imagens binárias também são chamadas de nível duplo ou de dois níveis. Isso significa que cada pixel é armazenado como um único bit, ou seja, um 0 ou 1. Os nomes em preto-e-branco, P & B, monocromático ou monocromático são usados ​​com frequência para esse conceito, mas também podem designar imagens que tenham apenas uma amostra. por pixel, como imagens em tons de cinza. No jargão do Photoshop, uma imagem binária é a mesma que uma imagem no modo “Bitmap”.

Imagens binárias geralmente surgem no processamento de imagens digitais como máscaras ou como resultado de certas operações, como segmentação, limite e dithering. Alguns dispositivos de entrada / saída, como impressoras a laser, máquinas de fax e telas de computador de dois níveis, só podem manipular imagens de dois níveis.

Uma imagem binária pode ser armazenada na memória como um bitmap, uma matriz de bits compactada. Uma imagem de 640 × 480 requer 37,5 KiB de armazenamento. Devido ao pequeno tamanho dos arquivos de imagem, as soluções de fax e gerenciamento de documentos geralmente usam esse formato. A maioria das imagens binárias também é bem compactada com esquemas de compactação de comprimento de execução simples.

Imagens binárias podem ser interpretadas como subconjuntos da rede inteira bidimensional Z2; o campo do processamento de imagens morfológicas foi amplamente inspirado por essa visão.

Operações em imagens binárias
Uma classe inteira de operações em imagens binárias opera em uma janela 3 × 3 da imagem. Contém nove pixels, portanto, 512 (2 ^ 9) valores possíveis. Considerando apenas o pixel central, é possível definir se ele permanece definido ou não, com base nos pixels adjacentes. Exemplos de tais operações são o desbaste, a dilatação, a localização de pontos de ramificação e pontos de extremidade, a remoção de pixels isolados, o deslocamento da imagem em um pixel em qualquer direção e a quebra de conexões-H. O Jogo da Vida de Conway também é um exemplo de uma operação de janela 3 × 3.

Outra classe de operações é baseada na noção de filtragem com um elemento estruturante. O elemento estruturante é uma imagem binária, geralmente pequena, que é passada sobre a imagem de destino, de maneira semelhante a um filtro no processamento de imagens em escala de cinza. Como os pixels só podem ter dois valores, as operações morfológicas são erosão (quaisquer pixels não definidos dentro do elemento estruturante fazem com que o pixel fique indefinido) e dilatação (qualquer conjunto de pixels dentro do elemento estruturante faz com que o pixel seja definido). Operações importantes são a abertura morfológica e o fechamento morfológico que consistem em erosão seguida de dilatação e dilatação seguida de erosão, respectivamente, utilizando o mesmo elemento estruturante. A abertura tende a ampliar pequenos furos, remover pequenos objetos e separar objetos. O fechamento retém pequenos objetos, remove furos e une objetos.

Uma característica muito importante de uma imagem binária é a transformação da distância. Isso fornece a distância de cada pixel definido do pixel não definido mais próximo. A transformação de distância pode ser calculada com eficiência. Permite o cálculo eficiente de diagramas de Voronoi, onde cada pixel em uma imagem é atribuído ao mais próximo de um conjunto de pontos. Ele também permite a esqueletização, que difere do desbaste em que os esqueletos permitem a recuperação da imagem original. A transformação de distância também é útil para determinar o centro do objeto e para corresponder ao reconhecimento de imagem.

Outra classe de operações é a coleta de métricas sem orientação. Isso geralmente é importante no reconhecimento de imagem, no qual a orientação da câmera precisa ser removida. As métricas livres de orientação de um grupo de pixels conectados ou circundados incluem o número de Euler, o perímetro, a área, a compactação, a área dos furos, o raio mínimo, o raio máximo.

Segmentação de imagens
Imagens binárias são produzidas a partir de imagens coloridas por segmentação. Segmentação é o processo de atribuir cada pixel na imagem de origem a duas ou mais classes. Se houver mais de duas classes, o resultado usual é várias imagens binárias. A forma mais simples de segmentação é provavelmente o método de Otsu que atribui pixels ao primeiro plano ou ao segundo plano com base na intensidade da escala de cinza. Outro método é o algoritmo de bacias hidrográficas. A detecção de bordas também cria frequentemente uma imagem binária com alguns pixels atribuídos aos pixels da borda, e também é um primeiro passo na segmentação adicional.

Esqueletos
O desbaste ou a esqueletização produzem imagens binárias que consistem em linhas de largura de pixel. Os pontos de ramificação e os pontos finais podem então ser extraídos e a imagem convertida em um gráfico. Isso é importante no reconhecimento de imagens, por exemplo, no reconhecimento óptico de caracteres.

Interpretação
A interpretação do valor binário do pixel também é dependente do dispositivo. Alguns sistemas interpretam o valor do bit 0 como preto e 1 como branco, enquanto outros invertem o significado dos valores. Na interface de PC padrão TWAIN para scanners e câmeras digitais, o primeiro sabor é chamado de baunilha e o chocolate invertido.

O pontilhamento é freqüentemente usado para exibir imagens de meio-tom.

Sensor de imagem captura imagens binárias
O sensor de imagem binária oversampled é um novo sensor de imagem que faz lembrar o filme fotográfico tradicional. Cada pixel no sensor tem uma resposta binária, fornecendo apenas uma medida quantizada de um bit da intensidade da luz local.