Zlepšené funkcie rozpoznávania
Nový FineReader 12 Professional prináša podstatnú zmenu, a to zrýchlenie analýzy stránok a možnosť používať dokument počas konverzie. V praxi to znamená, že môžete s obsahom pracovať postupne, aj keď sa proces ešte neskončil. To dáva nový smer a silu digitalizácii dokumentov.
Napríklad pri analýze OCR v 100-stranovom dokumente to môže trvať aj niekoľko minút. Každá strana sa postupne analyzuje a na priebehu vidno, kde môžete začať vykonávať úpravy. Tie prebiehajú rovnako ako v predošlých verziách. Teda podľa typu formátovania sú jednotlivé oblasti označené a kategorizované ako obrázky alebo sekcie bez rozpoznania, texty a tabuľky. Počas tohto procesu je zachovaná aj formátovacia značka oblasti, takže napríklad záhlavie zostane skutočne záhlavím aj pri prevode dokumentov.
Strany sa spracujú automaticky pri ich pridaní do zoznamu strán. Vo výsledku môžete zároveň kombinovať dokumenty a zostaviť z nich jeden nový. Či už pôjde o PDF s OCR, ak bolo PDF len vo forme obrázkov na stranách, alebo o dokumenty a tabuľky. Štandardne je načítanie stránok po ich pridaní zapnuté, v prípade potreby sa dá táto funkcia vypnúť. Ak sa ešte len chystáte dokument digitalizovať, je tu niekoľko možností na opravu poškodeného originálu.
Nie vždy je totiž naskenovanie úplne bezchybné a nezáleží na tom, či ide o vstup z podávača, alebo tabule skenera. FineReader má v nastaveniach niekoľko špeciálnych volieb. Opraví pokrivené čiary a, samozrejme, zistí aj orientáciu strany. Sú to detaily, ktoré pri mnohých stranách ušetria čas a starosti. Štandardne je aktivovaná funkcia na opravu lichobežníkového skreslenia.
Tým sa dáva priestor na analýzu fotografií z mobilu a ich prevod na text. Bežne totiž nemožno odfotiť predlohu úplne rovno, a to najmä pre odlesky svetiel a blesku fotoaparátu. V rámci rozšírených funkcií na úpravu fotografií sú tu ďalšie možnosti, na ktoré nepotrebujete samostatný editor obrázkov. Ide napríklad o automatické rozpoznávanie okrajov strany alebo vybielenie pozadia.
Práve druhá funkcia zaistí čitateľnejší obsah pre rozpoznávací algoritmus. Zároveň je tu podpora skenovania kníh a špeciálnych predlôh rozdeľovaním strán. Využiť to možno napríklad aj na predlohách formátu A3, na ktorom sú dve strany formátu A4. V spracovanom dokumente budú rozdelené na samostatné strany a PDF alebo wordový dokument bude mať bežné rozmery strán bez dodatočných úprav. Počas rozpoznávania sa nejasné znaky označia a používateľ je na to upozornený. Testovacie dokumenty boli rozpoznané v drvivej väčšine správne, softvér poukázal na spojenie znaku % hneď za číslicou alebo pri písmenách ako m a n. Výhodné je, že značky sú farebne odlíšené, a tak používateľ hneď vie, kde by mohlo byť rozpoznanie nesprávne.
Funkcie pri spracovaní dokumentov
Link: www.abbyy.sk