Inkrementális beszédfordítás

Székely, Imre

Inkrementális beszédfordítás

Fájlok

Diplomamunka(3.78 MB)

Dátum

2007-03-20T11:14:47Z

Szerzők

Székely, Imre

Absztrakt

Az emberi beszéd inkrementális jellegű, ami azt jelenti, hogy már kifejezés töredékekből is képesek vagyunk kikövetkeztetni (kitalálni), hogy mi lehet a teljes kifejezés. Például, ha valaki belekezd egy mondatba, meg tudjuk mondani, hogy mi lesz a vége még mielőtt teljes egészében elhangz... . Ez az egyszerű kis példa jól szemlélteti az inkrementális jelleget, az inkrementális beszédfeldolgozó is ehhez hasonlóan működik. Felmerül azonban az a kérdés, hogy jobbak-e az inkrementális rendszerek, mint a hagyományosak, illetve van-e valami hátrányos tulajdonságuk. A fent említett pozitív tényező mellett számolni kell azzal, hogy az inkrementális rendszerek sokkal összetettebbek és bonyolultabbak. Így nyilvánvalóan költségesebbek, de hát nincs mit tenni, szükségesek a jó hatásfokú gépi fordításhoz. Az ebben a munkában bemutatásra kerülő rendszerek az emberi beszédértésnek éppen ezt a sajátosságát használják ki annak érdekében, hogy a beszélt nyelv fordítása minél gyorsabban megvalósulhasson (hasonlóan a szimultán fordításhoz). Az interaktív rendszereknél nagyon fontos az, hogy a felhasználó minél rövidebb idő elteltével kapjon választ a számítógéptől. Az inkrementális feldolgozás lehetővé teszi, hogy elkezdődjön az output előállítása még mielőtt az input teljes egészében ismert lenne, ezáltal nő a feldolgozási sebesség és a hatékonyság. Így nem szükséges megvárni, hogy az egész input a rendelkezésünkre álljon. Az első fejezetben az inkrementális rendszerekről lesz szó általánosságban. Szó lesz az inkrementalitás fogalmáról, jellemzőiről, fajtáiról. Megemlítünk néhány régebbi rendszert, melyek az itt bemutatásra kerülő inkrementális beszédfordító rendszer alapjául szolgálnak. A második fejezet egy konkrét beszédfordító rendszert tárgyal, név szerint a MILC rendszert (Machine Interpreting with Layered Charts – Gépi Fordítás Rétegzett Diagramokkal). Leírjuk a MILC főbb jellemzőit, felvázoljuk a szerkezeti felépítését, majd kitérünk az egyes komponensek részletes bemutatására. Végül szó lesz a fordítási folyamat megjelenítéséről és végül a rendszer egyes összetevőinek programsorokban számolt méretéről. A diplomamunka célja tehát az, hogy megismerkedjünk az inkrementális gépi fordító rendszerekkel általánosságban és egy konkrét beszédfeldolgozó rendszerrel (a MILC-cel) nagyobb részletességgel, így egy átfogó képet kaphatunk erről a témáról. Ezen munka alapjául Jan Willers Amtrup „Incremental Speech Translation” című könyve szolgált, mely nagy segítséget nyújtott a diplomamunka összeállításában.

Kulcsszavak

inkrementális

Hivatkozás

http://hdl.handle.net/2437/1336

Gyűjtemények

Hallgatói dolgozatok (Informatikai Kar)

A tétel részletes nézete