đ„ Egy rĂ©gebbi melĂłm, de mĂ©g mindig menĆ! đ
Itt Ă©ppen egy Ășjabb OCR-hibĂĄs szöveget vadĂĄszok le â nem is akĂĄrhogyan! A kĂ©pen felĂŒl lĂĄthatĂł a mĂĄr javĂtott verziĂł, alatta pedig az eredeti, tele elcsĂșszott betƱkkel, fĂ©lrehĂșzott karakterekkel Ă©s a gĂ©p ĂĄltal fĂ©lreolvasott szavakkal. Az ilyen javĂtĂĄsoknĂĄl mindig az aprĂłsĂĄgok döntik el, hogy egy szöveg Ă©lvezhetĆ marad-e, vagy olyan lesz, mint egy hamisan csengĆ dallam.
đ Mik a leggyakoribb OCR-hibĂĄk?
-
A betƱk elmosĂłdnak, Ă©s egy ârnâ pĂ©ldĂĄul âmâ-nek tƱnik.
-
Az âOâ Ă©s a â0â összekeveredik, fĆleg rĂ©gi nyomtatvĂĄnyoknĂĄl.
-
A rĂ©gi szövegekben az âsâ Ă©s az âfâ is könnyen cserĂ©lĆdhet, mert a rĂ©gi nyomtatĂĄsi stĂlus mĂĄskĂ©pp formĂĄzta ezeket a betƱket.
-
Egy-egy halvĂĄny betƱ egyszerƱen eltƱnik, vagy egy teljesen mĂĄs karakter kerĂŒl a helyĂ©re.
đ” MiĂ©rt vannak jelölve kĂ©kkel a bizonytalan betƱk?
Mert azok a legtrĂŒkkösebbek! Ezek a karakterek gyakran halvĂĄnyak a szkennelĂ©s sorĂĄn, Ă©s az OCR szoftver sem tudja pontosan beazonosĂtani Ćket. EzĂ©rt mindig Ă©rdemes alaposan ĂĄtnĂ©zni a szöveget, hogy ne maradjanak benne olyan hibĂĄk, amik elrontanĂĄk az olvasĂĄs Ă©lmĂ©nyĂ©t.
Egy rosszul javĂtott e-könyv olyan, mint egy lyukas pohĂĄr â akĂĄrhogy prĂłbĂĄlod Ă©lvezni, valahol mindig elcsorog a lĂ©nyeg. đ
đ„ OCR-javĂtĂĄs? BetƱmentĂ©s? Ez az Ă©n terepem! đȘ
Nincs olyan hibĂĄs szöveg, amit ne tudnĂ©k megmenteni. Ez nem csak egy egyszerƱ melĂł â ez egy kĂŒldetĂ©s, Ă©letcĂ©l. Az elveszett betƱk visszahozĂĄsa, az olvashatatlan sorok helyreĂĄllĂtĂĄsa olyan Ă©rzĂ©s, mintha egy kopott könyv Ășj Ă©letet kapna.
Ăs te? TalĂĄlkoztĂĄl mĂĄr olyan e-könyvvel, amit alig lehetett olvasni a hibĂĄk miatt?