Imitation learning és curriculum learning technikák ötvözése a megerősítéses tanulás alapú rendszerek effektívebb tanítása érdekében

Dátum
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

A megerősítéses tanulás a gépi tanulás világának egy alterülete. Hasonlóan a többi területhez ez a technika is idő és adat-igényes. Az igények csökkentése érdekében az imitation learning és a curriculum learning módszereket szokás alkalmazni. Ebben a munkában azt vizsgáljuk, hogy mennyire gyorsítja meg a tanítási folyamatot egy-egy ilyen módszer alkalmazása, valamint a két módszer ötvözése. A szükséges vizsgálatok elvégzéséhez egy konkrét környezetet fogunk felhasználni, amely a Super Mario Bros videojáték. A Double Deep Q Network neurális hálót alkalmaztuk, mivel a jelenleg ismert modellek közül ez az egyik legegyszerűbb, amely képes megbírkózni a feladattal.

Leírás
Kulcsszavak
reinforcement learning, machine learning, training
Forrás