Imitation learning és curriculum learning technikák ötvözése a megerősítéses tanulás alapú rendszerek effektívebb tanítása érdekében
Absztrakt
A megerősítéses tanulás a gépi tanulás világának egy alterülete. Hasonlóan a többi területhez ez a technika is idő és adat-igényes. Az igények csökkentése érdekében az imitation learning és a curriculum learning módszereket szokás alkalmazni. Ebben a munkában azt vizsgáljuk, hogy mennyire gyorsítja meg a tanítási folyamatot egy-egy ilyen módszer alkalmazása, valamint a két módszer ötvözése. A szükséges vizsgálatok elvégzéséhez egy konkrét környezetet fogunk felhasználni, amely a Super Mario Bros videojáték. A Double Deep Q Network neurális hálót alkalmaztuk, mivel a jelenleg ismert modellek közül ez az egyik legegyszerűbb, amely képes megbírkózni a feladattal.
Leírás
Kulcsszavak
reinforcement learning, machine learning, training