Jakie są wady optycznego rozpoznawania znaków?

Główną wadą skanowania optycznego rozpoznawania znaków jest możliwość wprowadzenia błędów w zeskanowanym dokumencie. Żaden system skanowania OCR nie jest nieomylny, a dokumenty o niskiej jakości mogą powodować wystarczająco dużo błędów, aby wymagać długiego i dłuższego czasu. konsumowanie korekty. Czcionki pisma ręcznego i czcionki inne niż łacińskie są szczególnie trudne do prawidłowego skanowania.

Skanery optyczne mogą mieć również problemy z dokumentami, które nie mają znacznego kontrastu między znakami a tłem. Brudne strony lub wydrukowane na kolorowych materiałach mogą zmylić skaner i spowodować powstanie dużych bloków nieprzeczytanego tekstu. Dodatkowe kroki niezbędne do zapewnienia niskiej jakości oryginałów odpowiednich do skanowania OCR mogą całkowicie skompensować potencjalne oszczędności czasu oferowane przez technologię.

Najlepszym sposobem zapewnienia, aby skanowanie OCR było tak dokładne i szybkie, jak to możliwe, jest zaprojektowanie oryginalnego dokumentu specjalnie do skanowania optycznego. Na przykład wiele pakietów OCR ma trudności z odróżnianiem podobnych znaków, takich jak cyfra zero i litera O. Czcionki przyjazne dla OCR sprawiają, że te dwa znaki wyglądają tak, jak to tylko możliwe, aby pomóc komputerowi w odczytaniu dokumentu.

Odręczne dokumenty wymagają równomiernego odstępu między literami, aby zapewnić prawidłowe skanowanie. Właśnie dlatego formularze wykorzystujące technologię OCR często wymagają od użytkowników drukowania dużymi literami w serii pudełek. Każde oddzielne pudełko można następnie zeskanować pojedynczo, co uniemożliwi komputerowi błędne odczytanie liter, które są razem.