Imitation learning és curriculum learning technikák ötvözése a megerősítéses tanulás alapú rendszerek effektívebb tanítása érdekében
| dc.contributor.advisor | Horváth, Géza | |
| dc.contributor.author | Hidi, Erik Zoltán | |
| dc.contributor.department | DE--Informatikai Kar | hu_HU |
| dc.date.accessioned | 2022-04-25T05:47:40Z | |
| dc.date.available | 2022-04-25T05:47:40Z | |
| dc.date.created | 2022 | |
| dc.description.abstract | A megerősítéses tanulás a gépi tanulás világának egy alterülete. Hasonlóan a többi területhez ez a technika is idő és adat-igényes. Az igények csökkentése érdekében az imitation learning és a curriculum learning módszereket szokás alkalmazni. Ebben a munkában azt vizsgáljuk, hogy mennyire gyorsítja meg a tanítási folyamatot egy-egy ilyen módszer alkalmazása, valamint a két módszer ötvözése. A szükséges vizsgálatok elvégzéséhez egy konkrét környezetet fogunk felhasználni, amely a Super Mario Bros videojáték. A Double Deep Q Network neurális hálót alkalmaztuk, mivel a jelenleg ismert modellek közül ez az egyik legegyszerűbb, amely képes megbírkózni a feladattal. | hu_HU |
| dc.description.course | PTI | hu_HU |
| dc.description.degree | MSc/MA | hu_HU |
| dc.format.extent | 42 | hu_HU |
| dc.identifier.uri | http://hdl.handle.net/2437/331401 | |
| dc.language.iso | hu | hu_HU |
| dc.subject | reinforcement learning | hu_HU |
| dc.subject | machine learning | hu_HU |
| dc.subject | training | hu_HU |
| dc.subject.dspace | DEENK Témalista::Informatika | hu_HU |
| dc.title | Imitation learning és curriculum learning technikák ötvözése a megerősítéses tanulás alapú rendszerek effektívebb tanítása érdekében | hu_HU |