Természetes nyelvi korpuszok félautomatikus annotálása

Dátum
2013-05-22T08:36:35Z
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

Dolgozatomban azt tűztem ki célul, hogy összefüggéseiben bemutassam egy korpuszok félautomatikus annotálására szolgáló rendszer funkcióját, jellemzőit és működésének bizonyos elemeit. A 2-4. fejezetben vázoltam, hogy milyen tudománytörténeti előzmények után fordult a számítógépes nyelvészet figyelme a korpuszok felé, melyek a főbb jellegzetességei az ennek nyomán kialakult új kutatási paradigmának – a statisztikai számítógépes nyelvészetnek –, és milyen szerepet játszanak az utóbbiban a korpuszok, ezen belül is az annotált korpuszok. Az 5. és 6. fejezetben összefoglaltam a későbbiekben ismertetett rendszerrel kapcsolatban megfogalmazódott fontosabb követelményeket és a rendszer általános szerkezetét. A 7. és 8. fejezetben a rendszer felhasználói felületét és adatmodelljét ismertettem úgymond külső szemszögből, majd a 9. fejezetben ezeket (továbbá a szövegek tokenizálását) az implementáció irányából is megvizsgáltam.

Leírás
Kulcsszavak
korpusznyelvészet, számítógépes nyelvészet
Forrás