Természetes nyelvi korpuszok félautomatikus annotálása

Pethő, Gergely

Természetes nyelvi korpuszok félautomatikus annotálása

Dátum

2013-05-22T08:36:35Z

Szerzők

Pethő, Gergely

Absztrakt

Dolgozatomban azt tűztem ki célul, hogy összefüggéseiben bemutassam egy korpuszok félautomatikus annotálására szolgáló rendszer funkcióját, jellemzőit és működésének bizonyos elemeit. A 2-4. fejezetben vázoltam, hogy milyen tudománytörténeti előzmények után fordult a számítógépes nyelvészet figyelme a korpuszok felé, melyek a főbb jellegzetességei az ennek nyomán kialakult új kutatási paradigmának – a statisztikai számítógépes nyelvészetnek –, és milyen szerepet játszanak az utóbbiban a korpuszok, ezen belül is az annotált korpuszok. Az 5. és 6. fejezetben összefoglaltam a későbbiekben ismertetett rendszerrel kapcsolatban megfogalmazódott fontosabb követelményeket és a rendszer általános szerkezetét. A 7. és 8. fejezetben a rendszer felhasználói felületét és adatmodelljét ismertettem úgymond külső szemszögből, majd a 9. fejezetben ezeket (továbbá a szövegek tokenizálását) az implementáció irányából is megvizsgáltam.

Kulcsszavak

korpusznyelvészet, számítógépes nyelvészet

Hivatkozás

http://hdl.handle.net/2437/168846

Gyűjtemények

Hallgatói dolgozatok (Informatikai Kar)

A tétel részletes nézete