Megerősítéses tanuláson alapuló ágens fejlesztése a Pong játékhoz
Fájlok
Dátum
Szerzők
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt
A szakdolgozat betekintést nyújt a megerősítéses tanulás legfontosabb elméleti alapjaiba. Ismerteti a Markov döntési folyamatokat, a felfedezés és kihasználás problémáját, és az egyes érték függvény becslésre szolgáló módszereket. Továbbá bemutatja a Q-tanuló algoritmust. Kitér a Pong környezet állapottér reprezentációjára, valamint a konkrét megvalósítására.Végül pedig bemutatja a játékhoz felhasznált Mély Q-tanuló algoritmust, a tanítás folyamatát, és hogy az egyes elkészült modellek milyen eredményeket produkáltak.
Leírás
Kulcsszavak
megerősítéses tanulás, mesterséges intelligencia