? Evnen til at scanne et dokument ind maskinlæsbar form er en mageløs tidsbesparelse. Snarere end retyping dokumentet , og eventuelt indsætte fejl selv , scanne den og passerer det scannede billede gennem en software- læser kan resultere i en redigerbar dokument med en høj grad af nøjagtighed i forhold til den oprindelige . Denne software proces kaldes optisk tegngenkendelse . Optical Character Recognition
optisk tegngenkendelse ( OCR ) er en proces, hvor trykt eller håndskrevet tekst er mekanisk eller elektronisk læst og omdannet til en form, genkendes af en computer. Den sofistikeret proces ser brevet former, og sammenligner dem med et bibliotek af lignende former. Når en kamp er foretaget, er en karakter , der repræsenterer det mønster, der vises på skærmen , eller indføres i en computer -fil. OCR gør det muligt for et dokument, der skal scannes og læses af en computer og opretter en fil , der kan redigeres eller handlet på på andre måder.
OCR Software
computer software bruges til moderne OCR gennemførelse. Den software har avancerede fra sin tidligste dage , hvor programmerne skulle kalibreres for hver unik font var det forventet at genkende. Den er tilgængelig i standalone form, som et program specielt skabt til opgaven, og som en komponent i scanning software . Fremkomsten af internettet og cloud computing har ført til udvikling af web-baserede OCR-programmer , hvilket eliminerer behovet for individuelle desktop eller server installationer.
Anerkendelsesprocessen
< br >
OCR -software fungerer ved først at anerkende sondringen mellem lyse og mørke områder i det scannede billede. Da det opdager en lys-mørke skelnen , softwaren ser for genkendelige mønstre, såsom lodrette og vandrette linjer , såvel som forbundne eller delvis kurver. Hvis det kan genkende et mønster som et bogstav eller andet tegn , søger sin database for den tilsvarende karakter i computerens sprog indstillet. Derefter passerer denne karakter på det dokument eller display er det montage. Hvis softwaren ikke er i stand til at genkende et tegn , kan det gøre sit bedste gæt eller erstatte en alternativ karakter for at holde processen i gang .
Potentielle problemer med OCR -software
< p> Siden OCR -software er afhængig af mønstergenkendelse , ethvert artefakt på den side, der potentielt kan påvirke denne proces er en kilde til problemer . OCR fungerer bedst, når der er en klar skelnen mellem tegnene og baggrunden af dokumentet , ideelt sort på hvidt. Farvede eller optaget baggrunde , der gør de mønstre mindre særpræg kan forårsage problemer. Udtværinger , folder og andre skader til dokumentet kan resultere i fejlagtig tegngenkendelse så godt.