Inkrementális beszédfordítás
Fájlok
Dátum
Szerzők
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt
Az emberi beszéd inkrementális jellegű, ami azt jelenti, hogy már kifejezés töredékekből is képesek vagyunk kikövetkeztetni (kitalálni), hogy mi lehet a teljes kifejezés. Például, ha valaki belekezd egy mondatba, meg tudjuk mondani, hogy mi lesz a vége még mielőtt teljes egészében elhangz... . Ez az egyszerű kis példa jól szemlélteti az inkrementális jelleget, az inkrementális beszédfeldolgozó is ehhez hasonlóan működik. Felmerül azonban az a kérdés, hogy jobbak-e az inkrementális rendszerek, mint a hagyományosak, illetve van-e valami hátrányos tulajdonságuk. A fent említett pozitív tényező mellett számolni kell azzal, hogy az inkrementális rendszerek sokkal összetettebbek és bonyolultabbak. Így nyilvánvalóan költségesebbek, de hát nincs mit tenni, szükségesek a jó hatásfokú gépi fordításhoz. Az ebben a munkában bemutatásra kerülő rendszerek az emberi beszédértésnek éppen ezt a sajátosságát használják ki annak érdekében, hogy a beszélt nyelv fordítása minél gyorsabban megvalósulhasson (hasonlóan a szimultán fordításhoz). Az interaktív rendszereknél nagyon fontos az, hogy a felhasználó minél rövidebb idő elteltével kapjon választ a számítógéptől. Az inkrementális feldolgozás lehetővé teszi, hogy elkezdődjön az output előállítása még mielőtt az input teljes egészében ismert lenne, ezáltal nő a feldolgozási sebesség és a hatékonyság. Így nem szükséges megvárni, hogy az egész input a rendelkezésünkre álljon. Az első fejezetben az inkrementális rendszerekről lesz szó általánosságban. Szó lesz az inkrementalitás fogalmáról, jellemzőiről, fajtáiról. Megemlítünk néhány régebbi rendszert, melyek az itt bemutatásra kerülő inkrementális beszédfordító rendszer alapjául szolgálnak. A második fejezet egy konkrét beszédfordító rendszert tárgyal, név szerint a MILC rendszert (Machine Interpreting with Layered Charts – Gépi Fordítás Rétegzett Diagramokkal). Leírjuk a MILC főbb jellemzőit, felvázoljuk a szerkezeti felépítését, majd kitérünk az egyes komponensek részletes bemutatására. Végül szó lesz a fordítási folyamat megjelenítéséről és végül a rendszer egyes összetevőinek programsorokban számolt méretéről. A diplomamunka célja tehát az, hogy megismerkedjünk az inkrementális gépi fordító rendszerekkel általánosságban és egy konkrét beszédfeldolgozó rendszerrel (a MILC-cel) nagyobb részletességgel, így egy átfogó képet kaphatunk erről a témáról. Ezen munka alapjául Jan Willers Amtrup „Incremental Speech Translation” című könyve szolgált, mely nagy segítséget nyújtott a diplomamunka összeállításában.