Imitation learning és curriculum learning technikák ötvözése a megerősítéses tanulás alapú rendszerek effektívebb tanítása érdekében

Hidi, Erik Zoltán

Imitation learning és curriculum learning technikák ötvözése a megerősítéses tanulás alapú rendszerek effektívebb tanítása érdekében

Szerzők

Absztrakt

A megerősítéses tanulás a gépi tanulás világának egy alterülete. Hasonlóan a többi területhez ez a technika is idő és adat-igényes. Az igények csökkentése érdekében az imitation learning és a curriculum learning módszereket szokás alkalmazni. Ebben a munkában azt vizsgáljuk, hogy mennyire gyorsítja meg a tanítási folyamatot egy-egy ilyen módszer alkalmazása, valamint a két módszer ötvözése. A szükséges vizsgálatok elvégzéséhez egy konkrét környezetet fogunk felhasználni, amely a Super Mario Bros videojáték. A Double Deep Q Network neurális hálót alkalmaztuk, mivel a jelenleg ismert modellek közül ez az egyik legegyszerűbb, amely képes megbírkózni a feladattal.

Kulcsszavak

reinforcement learning, machine learning, training

Hivatkozás

http://hdl.handle.net/2437/331401

Gyűjtemények

Hallgatói dolgozatok (Informatikai Kar)

A tétel részletes nézete