Dokumentumok számítógépes feldolgozása

Dátum
2008-04-25T06:44:11Z
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

Napjainkban megkérdőjelezhetetlen szerepe van a számítógépeknek, amelyek csak digitális adatokon képesek műveleteket elvégezni. Az emberiség történelme során felhalmozóodott emlékek túlnyomórészt írásos és nyomtatott anyagok. Megjelent az igény ezen információk számítógéppel történő feldolgozására. A való világban analóg képekkel találkozunk, ezeket kell digitalizálnunk egy céleszközzel, ami lehet egy fényképezőgép vagy egy szkenner. A digitális képből információt kinyerni nem egyszerű, de már számos célszoftver született erre a feladatra. Ezen szoftverek többsége karakterfelismerésre specializálódott. Nehéz olyat találni viszont, amelyik kitöltött űrlapok feldolgozását végzi. A diplomamunka keretében a célom egy olyan szoftver elkészítése volt, amely űrlapok kitöltésének automatikus feldolgozását végzi, majd az eredményt elemzi és megfelelő kimeneti formátumban továbbítja. Ezeket ismert algoritmusok és technológiák segítségével igyekeztem megvalósítani, ezért döntöttem a .NET keretrendszer és a C# nyelv mellett. Törekedtem arra, hogy a feldolgozás lépései a lehető legáltalánosabban történjenek. Nem építettem be a kódba a tesztelt űrlapok feldolgozásához szükséges speciális ismereteket. Az űrlapok tulajdonsáagait külső, XML struktúrájú konfigurációs fájlokban tárolom. A tervem az volt, hogy egy a szoftverről és a háttérben lévő algoritmusokról is megfelelő ismeretekkel rendelkező személy képes legyen a konfiguraciós fájlokat tetszőleges űrlap feldolgozásához elkészíteni.

Leírás
Kulcsszavak
elemzés, hough, karakterfelismerés, ocr, walsh, uml, xml, xslt
Forrás