Megerősítéses tanulás alkalmazása akadálypálya teljesítéséhez
Fájlok
Dátum
Szerzők
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt
A szakdolgozat a megerősítéses tanulás használatát vizsgálja a Unity játékfejlesztő platformon. A hangsúly az intelligens ágensek létrehozásán van, amelyek képesek áthaladni az akadálypályákon. A kutatás fókuszában a Proximal Policy Optimization (PPO) algoritmus áll, amelyet az ágens képzésére használtam különböző környezetekben. A szakdolgozat célja az volt, hogy bemutassa, hogyan javíthatja a megerősítéses tanulás az ágensek alkalmazkodóképességét és teljesítményét dinamikus játékkörnyezetekben. A szakdolgozat részletesen bemutatja a Unity ML-Agents Toolkit használatát, az ágensek tréningjének lépéseit és az algoritmusok implementálását. Végül az ágensek teljesítményét és a tanulási folyamatokat TensorBoard eszköz segítségével értékeli, biztosítva a modell fejlődésének elemzését és optimalizálási stratégiák hatékonyságának megértését.