Spin and Go póker ágens fejlesztése megerősítéses tanulással

Dátum
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

A diplomamunka célja egy Spin and Go pókerformátumra specializált mesterséges intelligencia ágens fejlesztése megerősítéses tanulás segítségével. A Spin and Go a No Limit Texas Hold’em gyorsított, háromfős változata, ahol a játék dinamikusabb és a szerencse szerepe is nagyobb. A dolgozat egy Python alapú környezetet mutat be, amely lehetővé teszi az ágensek tanítását és tesztelését. A fejlesztett ágens a Proximal Policy Optimization (PPO) algoritmust használja, amely lehetőséget ad különböző tanítási technikák, például a self-play és imitációs tanulás alkalmazására is. A cél olyan ágens kialakítása, amelyek képesek legyőzni véletlenszerű lépéseket választó ellenfeleket. További cél imitációs tanulással egy professzionális ágens létrehozása, amely egy pókerezni tudó ember lépéseit tanulja meg. A dolgozat végső lépése egy Unity alapú vizuális környezet létrehozása, amelyen segítségével grafikusan is látható, hogy a fejlesztett ágens milyen adatok alapján hozza meg a döntését. Ez a projekt egyszerre szolgálja a mesterséges intelligencia kutatását és annak gyakorlati alkalmazását egy összetett, nem teljesinformációs játékkörnyezetben.

Leírás
Kulcsszavak
Megerősítéses tanulás, póker
Forrás