Képfeldolgozás (karakterfelismerés)

Dátum
2014-05-06T12:42:54Z
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

Manapság egyre több dokumentum jelenik meg digitális formában, azonban még mindig nagyon fontos a nyomtatott és írott szövegek digitalizálása, valamint képekről való felismerése. Rengeteg szöveges anyagot szkennelünk, de ezek nyilván csak képek formájában kerülnek a háttértárakra, az akár több száz oldalas dokumentumokat rendkívül időigényes volna szimplán begépelni. Sokszor válik szükségessé a szövegek szerkeszthető formába öntése, ennél a problémánál segíthetnek a karakterfelismerő alkalmazások. A képfeldolgozás egyik jelentős területe a karakterfelismerés, amit másképpen optikai karakterfelismerésnek (angolul optical character recognition, röviden OCR) nevezzük. A felismerés tárgyát képező szövegtípusoknak alapvetően két fajtája van: az írott szöveg és számítógépes betűtípusok. Jelen dolgozatban elsősorban a leggyakoribb digitális betűtípusokkal írt szövegek képekről történő felismerésével foglalkozok, és e szempontokat figyelembe véve készítem el saját karakterfelismerő programomat. Napjainkra számos OCR alkalmazással (ingyenes és fizetős egyaránt) találkozhatunk, de azt elmondhatjuk, hogy maradéktalanul egyik sem képes 100%-os pontossággal dolgozni, mivel többféle tényező befolyásolhatja negatívan a karakterfelismerést, úgymint zaj, karakterek összefolyása, nem karakter elemek (ábrák) megjelenése, stb. A karakterfelismerő alkalmazások összehasonlító fejezetében szeretném kideríteni, hogy mely általam tesztelt OCR program a leghatékonyabb, és a saját programom hogyan állja meg a helyét közöttük.

Leírás
Kulcsszavak
karakterfelismerés, ocr
Forrás