Bogacsovics, GergőSzűcs, Ádám2025-06-262025-06-262025-04-16https://hdl.handle.net/2437/394806Dolgozatomban a megerősítéses tanulás modellezésével foglalkoztam a Unity játékfejlesztő motoron belül. Az volt a célom, hogy létrehozzak környezeteket több nehézségi szinten és ezekben tanítsam az ágenst. Az ágens fő feladata az volt, hogy megtanuljon eljutni egyik kijelölt pontból a másikba jutalmazási pontok érintésével, melyek után jutalmat kapott. Továbbá minél ideálisabb utat talált annál több jutalomban részesült. Bizonyos esetekben pedig büntetést, mint például ütközés, vagy borulás esetén. Dolgozatomban kitérek a megerősítéses tanulás történetére, a környezeteim felépítésére, a megerősítéses tanulás alkalmazására, valamint a tanítások eredményeire.43humegerősítéses tanulásUnityÖnjáró űrjármű irányítása megerősítéses tanulássalInformatika::InformációtechnológiaHozzáférhető a 2022 decemberi felsőoktatási törvénymódosítás értelmében.