Mudanças entre as edições de "OCR"
Linha 6: | Linha 6: | ||
Il Riconoscimento Ottico dei Caratteri (OCR, dall’inglese ''Optical Character Recognition'') è un insieme di strumenti atti a convertire il formato di un file da immagine a testo. Le immagini, nella maggior parte dei casi, sono create in grafica ''raster'', e funzionano quindi come una matrice in cui una grande quantità di punti, i pixel, formano un ampio spettro di colori intelligibili per l'occhio umano. Segue un esempio: | Il Riconoscimento Ottico dei Caratteri (OCR, dall’inglese ''Optical Character Recognition'') è un insieme di strumenti atti a convertire il formato di un file da immagine a testo. Le immagini, nella maggior parte dei casi, sono create in grafica ''raster'', e funzionano quindi come una matrice in cui una grande quantità di punti, i pixel, formano un ampio spettro di colori intelligibili per l'occhio umano. Segue un esempio: | ||
− | [[Arquivo:InFailla1.png| | + | [[Arquivo:InFailla1.png|700px|thumb|center|''Fig. 1. Immagine di un documento dell'inizio del XIX secolo ingrandita centinaia di volte, così da consentire l'identificazione dei pixel che, sotto forma di matrice, compongono l'immagine.'']] |
+ | L’OCR, una volta analizzate le sequenze di pixel, identifica al loro interno dei caratteri, trasformando la matrice in linguaggio vettoriale, ovvero in testo. Ad esempio, se si passa un’immagine contenente la parola “Vendesi!” a un OCR, questi confronterà uno per volta i gruppi di pixel che contengono ciascun glifo (''V maiuscola, E minuscola, N minuscola'', e così via fino al punto esclamativo) con le immagini dei caratteri che ha in memoria, e restituirà l’informazione testuale equivalente – cioè la stringa di caratteri “Vendesi”. | ||
}} | }} |
Edição das 20h11min de 23 de junho de 2021
2 minuti - per Andrea Failla |
Il Riconoscimento Ottico dei Caratteri (OCR, dall’inglese Optical Character Recognition) è un insieme di strumenti atti a convertire il formato di un file da immagine a testo. Le immagini, nella maggior parte dei casi, sono create in grafica raster, e funzionano quindi come una matrice in cui una grande quantità di punti, i pixel, formano un ampio spettro di colori intelligibili per l'occhio umano. Segue un esempio:
L’OCR, una volta analizzate le sequenze di pixel, identifica al loro interno dei caratteri, trasformando la matrice in linguaggio vettoriale, ovvero in testo. Ad esempio, se si passa un’immagine contenente la parola “Vendesi!” a un OCR, questi confronterà uno per volta i gruppi di pixel che contengono ciascun glifo (V maiuscola, E minuscola, N minuscola, e così via fino al punto esclamativo) con le immagini dei caratteri che ha in memoria, e restituirà l’informazione testuale equivalente – cioè la stringa di caratteri “Vendesi”.
Bibliografia e sitografia
Citazione di questo articolo |
Come citare: FAILLA, Andrea . "OCR". In: CLIOMATICA - Portale di Storia Digitale e ricerca. Disponibile in: https://lhs.unb.br/cliomatica/index.php?title=OCR. il giorno: 6/02/2025. |
Informare errori in questa pagina |