Önjáró űrjármű irányítása megerősítéses tanulással

Dátum
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

Dolgozatomban a megerősítéses tanulás modellezésével foglalkoztam a Unity játékfejlesztő motoron belül. Az volt a célom, hogy létrehozzak környezeteket több nehézségi szinten és ezekben tanítsam az ágenst. Az ágens fő feladata az volt, hogy megtanuljon eljutni egyik kijelölt pontból a másikba jutalmazási pontok érintésével, melyek után jutalmat kapott. Továbbá minél ideálisabb utat talált annál több jutalomban részesült. Bizonyos esetekben pedig büntetést, mint például ütközés, vagy borulás esetén. Dolgozatomban kitérek a megerősítéses tanulás történetére, a környezeteim felépítésére, a megerősítéses tanulás alkalmazására, valamint a tanítások eredményeire.

Leírás
Kulcsszavak
megerősítéses tanulás, Unity
Forrás