Categories: Tecnologia

Immagine binaria

Un’immagine binaria è un’immagine digitale che ha solo due valori possibili per ciascun pixel. In genere, i due colori utilizzati per un’immagine binaria sono in bianco e nero. Il colore utilizzato per l’oggetto (i) nell’immagine è il colore di primo piano mentre il resto dell’immagine è il colore di sfondo. Nell’industria della scansione di documenti, questo viene spesso definito “bi-tonale”.

Le immagini binarie sono anche chiamate a livello bi o a due livelli. Ciò significa che ciascun pixel viene memorizzato come un singolo bit, ovvero uno 0 o 1. I nomi in bianco e nero, B & N, monocromatico o monocromatico vengono spesso utilizzati per questo concetto, ma possono anche designare qualsiasi immagine che abbia un solo campione per pixel, ad esempio immagini in scala di grigi. Nel linguaggio di Photoshop, un’immagine binaria è la stessa di un’immagine in modalità “Bitmap”.

Le immagini binarie si presentano spesso nell’elaborazione delle immagini digitali come maschere o come risultato di determinate operazioni quali segmentazione, soglia e dithering. Alcuni dispositivi di input / output, come stampanti laser, fax e display di computer a due livelli, possono gestire solo immagini bilevel.

Un’immagine binaria può essere archiviata in memoria come una bitmap, una serie di bit compresso. Un’immagine 640 × 480 richiede 37,5 KiB di spazio. A causa delle ridotte dimensioni dei file immagine, le soluzioni di gestione dei fax e dei documenti solitamente utilizzano questo formato. La maggior parte delle immagini binarie si comprime bene anche con schemi di compressione di run-length semplici.

Le immagini binarie possono essere interpretate come sottoinsiemi del reticolo intero bidimensionale Z2; il campo dell’elaborazione delle immagini morfologiche è stato largamente ispirato da questo punto di vista.

Operazioni su immagini binarie
Un’intera classe di operazioni su immagini binarie opera su una finestra 3 × 3 dell’immagine. Questo contiene nove pixel, quindi 512 (2 ^ 9) valori possibili. Considerando solo il pixel centrale, è possibile definire se rimane impostato o non impostato, in base ai pixel circostanti. Esempi di tali operazioni sono il diradamento, la dilatazione, la ricerca di punti di diramazione e punti finali, la rimozione di pixel isolati, lo spostamento dell’immagine di un pixel in qualsiasi direzione e la rottura di connessioni H. Il gioco della vita di Conway è anche un esempio di un’operazione di finestra 3 × 3.

Un’altra classe di operazioni si basa sulla nozione di filtraggio con un elemento strutturante. L’elemento di strutturazione è un’immagine binaria, in genere piccola, che viene passata sull’immagine di destinazione, in modo simile a un filtro nell’elaborazione dell’immagine in scala di grigi. Poiché i pixel possono avere solo due valori, le operazioni morfologiche sono l’erosione (qualsiasi pixel non impostato all’interno dell’elemento di strutturazione causa l’annullamento del pixel) e la dilatazione (qualsiasi pixel impostato all’interno dell’elemento di strutturazione determina l’impostazione del pixel). Operazioni importanti sono l’apertura morfologica e la chiusura morfologica che consistono in erosione seguita da dilatazione e dilatazione seguite dall’erosione, rispettivamente, usando lo stesso elemento strutturante. L’apertura tende ad allargare piccoli fori, rimuovere piccoli oggetti e separare oggetti. La chiusura mantiene piccoli oggetti, rimuove buchi e unisce oggetti.

Related Post

Una caratteristica molto importante di un’immagine binaria è la trasformazione della distanza. Ciò fornisce la distanza di ogni pixel impostato dal pixel unset più vicino. La trasformazione della distanza può essere calcolata in modo efficiente. Consente un calcolo efficiente dei diagrammi di Voronoi, in cui ogni pixel di un’immagine è assegnato al più vicino di un insieme di punti. Permette anche la scheletrizzazione, che differisce dal diradamento in quanto gli scheletri consentono il recupero dell’immagine originale. La trasformazione della distanza è utile anche per determinare il centro dell’oggetto e per la corrispondenza nel riconoscimento dell’immagine.

Un’altra classe di operazioni sta raccogliendo le metriche senza orientamento. Questo è spesso importante nel riconoscimento dell’immagine in cui è necessario rimuovere l’orientamento della videocamera. Le metriche senza orientamento di un gruppo di pixel connessi o circondati includono il numero di Eulero, il perimetro, l’area, la compattezza, l’area dei fori, il raggio minimo, il raggio massimo.

Segmentazione dell’immagine
Le immagini binarie sono prodotte da immagini a colori per segmentazione. La segmentazione è il processo di assegnazione di ciascun pixel nell’immagine sorgente a due o più classi. Se ci sono più di due classi, il solito risultato sono diverse immagini binarie. La forma più semplice di segmentazione è probabilmente il metodo di Otsu che assegna i pixel al primo piano o allo sfondo in base all’intensità della scala dei grigi. Un altro metodo è l’algoritmo spartiacque. Anche il rilevamento dei bordi crea spesso un’immagine binaria con alcuni pixel assegnati ai pixel del bordo ed è anche il primo passo verso un’ulteriore segmentazione.

scheletri
L’assottigliamento o la scheletrizzazione produce immagini binarie costituite da linee a pixel. I branchpoint e gli endpoint possono quindi essere estratti e l’immagine convertita in un grafico. Questo è importante nel riconoscimento dell’immagine, ad esempio nel riconoscimento ottico dei caratteri.

Interpretazione
L’interpretazione del valore binario del pixel dipende anche dal dispositivo. Alcuni sistemi interpretano il valore di bit di 0 come nero e 1 come bianco, mentre altri invertono il significato dei valori. Nell’interfaccia PC standard TWAIN per scanner e fotocamere digitali, il primo aroma è chiamato vaniglia e il cioccolato invertito.

Il dithering viene spesso utilizzato per la visualizzazione di immagini a mezzitoni.

Il sensore di immagine acquisisce immagini binarie
Il sensore di immagine binario sovrastampato è un nuovo sensore di immagine che ricorda la pellicola fotografica tradizionale. Ogni pixel nel sensore ha una risposta binaria, fornendo solo una misura quantizzata a un bit dell’intensità della luce locale.

Share