Bogacsovics, GergőSarbak, Márkó2024-06-232024-06-232024-05-01https://hdl.handle.net/2437/374589A szakdolgozat a megerősítéses tanulás használatát vizsgálja a Unity játékfejlesztő platformon. A hangsúly az intelligens ágensek létrehozásán van, amelyek képesek áthaladni az akadálypályákon. A kutatás fókuszában a Proximal Policy Optimization (PPO) algoritmus áll, amelyet az ágens képzésére használtam különböző környezetekben. A szakdolgozat célja az volt, hogy bemutassa, hogyan javíthatja a megerősítéses tanulás az ágensek alkalmazkodóképességét és teljesítményét dinamikus játékkörnyezetekben. A szakdolgozat részletesen bemutatja a Unity ML-Agents Toolkit használatát, az ágensek tréningjének lépéseit és az algoritmusok implementálását. Végül az ágensek teljesítményét és a tanulási folyamatokat TensorBoard eszköz segítségével értékeli, biztosítva a modell fejlődésének elemzését és optimalizálási stratégiák hatékonyságának megértését.47huUnityJátékfejlesztésMegerősítéses tanulásMegerősítéses tanulás alkalmazása akadálypálya teljesítéséhezInformatikaHozzáférhető a 2022 decemberi felsőoktatási törvénymódosítás értelmében.