By przetransportować tekst z rzeczywistej kartki papieru musimy najpierw zapisać plik w formacie czytanym przez komputer. Potrzebny nam do tego skaner. Wiele firm od razu do skanera dodaje program do czytania znaków. Jeśli jednak go nie mamy – wystarczy pobrać z jednej ze stron udostępniających. Najlepszą opcja na rynku jest program: Abby PhotoReader, FineReader, OmniPage i Readiris. Ten pierwszy zalicza się już do kategorii specjalistycznych. Osobiście polecam ten drugi.
Poniżej opis jak działa program:
Uwaga!
Cala operacja „przepisania” tekstu w ten sposób zajmuje kilka minut. Cały proces jest prosty, jednak należy pamiętać, że program nie gwarantuje stuprocentowej skuteczności. Wartość procentowa to 99.9%. Oznacza to, że na stronie mogą nam się pojawić 4 błędy.
-
Krok pierwszy
Zanim zaczniemy rozpoznawanie znaków – potrzebny nam skan, prosty skaner albo rozbudowany kombajn skanujący – nie ma różnicy. Liczy się efekt.
-
Krok drugi
Podzial stron w programie to proces, dzięki któremu strona zostaje podzielona na elementy. Program ustala, gdzie znajduje się tekst, a gdzie elementy takie jak grafiki czy zdjęcia.
Automatycznie ustala nam akapity, potem słowa i znaki. Na zakończenie analizy całego układu (layoutu) program tworzy zbiór pojedynczych znaków i zapamiętuje – by później wykorzystać do logicznej całości.
-
Krok trzeci
Program musi poprawnie zidentyfikować rozpoznane znaki. Czy znak A to A, a może cyfra 5. Jeśli program się pomyli – ucierpi cały tekst – efekt domina. Aby ułatwić komputerom to zadanie opracowano specjalne czcionki. Programy do rozpoznawania tekstu nazywane są OCR – Optical Character Recognistion – czyli optyczne rozpoznawanie znaków; dlatego tez czcionka, która została opracowana jako pierwsza to OCR-A, a późniejsza – OCR-B.
-
Krok czwarty
Po zakończeniu rozpoznawania znaków – program zajmuje się całością tekstu. Za pomocą słownika ze znaków tworzy słowa, z słów – zdania – ze zdań – akapity.
-
Krok piąty
Ostatnim krokiem jest zapisanie tekstu – w formacie txt. lub jako pdf., doc. – itd.
Można skanować dokumenty z grafikami – pamiętajmy jednak, ze program nie widzi kolorów – a jedynie szarości, ponadto plik z materiałem graficznym będzie ważył więcej. Kolorowe tło dokumentu też nie ułatwi nam zadania.
Jeśli chodzi o skaner – niektóre z nich, te najprostsze, skanują tylko jedną stronę, podczas gdy np. jeden z modeli Fujitsu (profesjonalny skaner) wczytuje kilka stron na minutę, rejestrując obie strony kartki.
Czy często korzystacie z programów do rozpoznawania tekstu? Kiedy przydają się najbardziej? Dajcie znać w komentarzu.