Harangi, BalázsSzuhánszki, Soma2024-02-012024-02-012023https://hdl.handle.net/2437/365891A szakdolgozat betekintést nyújt a megerősítéses tanulás legfontosabb elméleti alapjaiba. Ismerteti a Markov döntési folyamatokat, a felfedezés és kihasználás problémáját, és az egyes érték függvény becslésre szolgáló módszereket. Továbbá bemutatja a Q-tanuló algoritmust. Kitér a Pong környezet állapottér reprezentációjára, valamint a konkrét megvalósítására.Végül pedig bemutatja a játékhoz felhasznált Mély Q-tanuló algoritmust, a tanítás folyamatát, és hogy az egyes elkészült modellek milyen eredményeket produkáltak.32humegerősítéses tanulásmesterséges intelligenciaMegerősítéses tanuláson alapuló ágens fejlesztése a Pong játékhozDEENK Témalista::InformatikaHozzáférhető a 2022 decemberi felsőoktatási törvénymódosítás értelmében.