Önjáró űrjármű irányítása megerősítéses tanulással
Fájlok
Dátum
Szerzők
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt
Dolgozatomban a megerősítéses tanulás modellezésével foglalkoztam a Unity játékfejlesztő motoron belül. Az volt a célom, hogy létrehozzak környezeteket több nehézségi szinten és ezekben tanítsam az ágenst. Az ágens fő feladata az volt, hogy megtanuljon eljutni egyik kijelölt pontból a másikba jutalmazási pontok érintésével, melyek után jutalmat kapott. Továbbá minél ideálisabb utat talált annál több jutalomban részesült. Bizonyos esetekben pedig büntetést, mint például ütközés, vagy borulás esetén. Dolgozatomban kitérek a megerősítéses tanulás történetére, a környezeteim felépítésére, a megerősítéses tanulás alkalmazására, valamint a tanítások eredményeire.
Leírás
Kulcsszavak
megerősítéses tanulás, Unity