Imitation learning és curriculum learning technikák ötvözése a megerősítéses tanulás alapú rendszerek effektívebb tanítása érdekében

Horváth, GézaHidi, Erik Zoltán2022-04-252022-04-252022http://hdl.handle.net/2437/331401A megerősítéses tanulás a gépi tanulás világának egy alterülete. Hasonlóan a többi területhez ez a technika is idő és adat-igényes. Az igények csökkentése érdekében az imitation learning és a curriculum learning módszereket szokás alkalmazni. Ebben a munkában azt vizsgáljuk, hogy mennyire gyorsítja meg a tanítási folyamatot egy-egy ilyen módszer alkalmazása, valamint a két módszer ötvözése. A szükséges vizsgálatok elvégzéséhez egy konkrét környezetet fogunk felhasználni, amely a Super Mario Bros videojáték. A Double Deep Q Network neurális hálót alkalmaztuk, mivel a jelenleg ismert modellek közül ez az egyik legegyszerűbb, amely képes megbírkózni a feladattal.42hureinforcement learningmachine learningtrainingImitation learning és curriculum learning technikák ötvözése a megerősítéses tanulás alapú rendszerek effektívebb tanítása érdekébenDEENK Témalista::Informatika