Mesterséges intelligencia tanuló algoritmusok összehasonlítása és alkalmazása

Dátum
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

A dolgozat a mesterséges intelligenciával foglalkozik, ezen a témán belül pedig a megerősítéses tanulással. A tanítás elkezdéséhez kiválasztottam két algoritmust, amelye a feladatok elvégzésére alkalmasak, illetve két feladatot, amelyekkel le tudjuk tesztelni az algoritmusok alkalmasságát. A két felhasznált algoritmus a Proximal Policy Optimization (PPO), illetve a Soft Actor-Critic (SAC) algoritmus. A PPO egy olyan szabályon alapuló (on-policy) algoritmus. A két különböző algoritmussal működő mesterséges intelligenciának két feladatot kellett vég-hezvinni. A feladatok pontosan az autóvezetés egy versenypályán és egy repülő irányítása. A megfigyeléseim kiemelik a két algoritmus közti különbséget, az egyes algoritmusok erős-ségeit és a gyengeségeit, és azt, hogy mely feladathoz alkalmazhatók leginkább.

Leírás
Kulcsszavak
Mesterséges Intelligencia, Megerősítéses Tanulás
Forrás