Természetes nyelvi korpuszok félautomatikus annotálása
Dátum
Szerzők
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt
Dolgozatomban azt tűztem ki célul, hogy összefüggéseiben bemutassam egy korpuszok félautomatikus annotálására szolgáló rendszer funkcióját, jellemzőit és működésének bizonyos elemeit. A 2-4. fejezetben vázoltam, hogy milyen tudománytörténeti előzmények után fordult a számítógépes nyelvészet figyelme a korpuszok felé, melyek a főbb jellegzetességei az ennek nyomán kialakult új kutatási paradigmának – a statisztikai számítógépes nyelvészetnek –, és milyen szerepet játszanak az utóbbiban a korpuszok, ezen belül is az annotált korpuszok. Az 5. és 6. fejezetben összefoglaltam a későbbiekben ismertetett rendszerrel kapcsolatban megfogalmazódott fontosabb követelményeket és a rendszer általános szerkezetét. A 7. és 8. fejezetben a rendszer felhasználói felületét és adatmodelljét ismertettem úgymond külső szemszögből, majd a 9. fejezetben ezeket (továbbá a szövegek tokenizálását) az implementáció irányából is megvizsgáltam.