Természetes nyelvi korpuszok félautomatikus annotálása

Mihálydeák, TamásPethő, Gergely2013-05-222013-05-222013-05-212013-05-22http://hdl.handle.net/2437/168846Dolgozatomban azt tűztem ki célul, hogy összefüggéseiben bemutassam egy korpuszok félautomatikus annotálására szolgáló rendszer funkcióját, jellemzőit és működésének bizonyos elemeit. A 2-4. fejezetben vázoltam, hogy milyen tudománytörténeti előzmények után fordult a számítógépes nyelvészet figyelme a korpuszok felé, melyek a főbb jellegzetességei az ennek nyomán kialakult új kutatási paradigmának – a statisztikai számítógépes nyelvészetnek –, és milyen szerepet játszanak az utóbbiban a korpuszok, ezen belül is az annotált korpuszok. Az 5. és 6. fejezetben összefoglaltam a későbbiekben ismertetett rendszerrel kapcsolatban megfogalmazódott fontosabb követelményeket és a rendszer általános szerkezetét. A 7. és 8. fejezetben a rendszer felhasználói felületét és adatmodelljét ismertettem úgymond külső szemszögből, majd a 9. fejezetben ezeket (továbbá a szövegek tokenizálását) az implementáció irányából is megvizsgáltam.70hukorpusznyelvészetszámítógépes nyelvészetTermészetes nyelvi korpuszok félautomatikus annotálásaDEENK Témalista::NyelvtudományDEENK Témalista::Informatika