Spin and Go póker ágens fejlesztése megerősítéses tanulással

Csóka, Péter

Spin and Go póker ágens fejlesztése megerősítéses tanulással

Fájlok

szakdolgozat(1.69 MB)

Szerzők

Csóka, Péter

Absztrakt

A diplomamunka célja egy Spin and Go pókerformátumra specializált mesterséges intelligencia ágens fejlesztése megerősítéses tanulás segítségével. A Spin and Go a No Limit Texas Hold’em gyorsított, háromfős változata, ahol a játék dinamikusabb és a szerencse szerepe is nagyobb. A dolgozat egy Python alapú környezetet mutat be, amely lehetővé teszi az ágensek tanítását és tesztelését. A fejlesztett ágens a Proximal Policy Optimization (PPO) algoritmust használja, amely lehetőséget ad különböző tanítási technikák, például a self-play és imitációs tanulás alkalmazására is. A cél olyan ágens kialakítása, amelyek képesek legyőzni véletlenszerű lépéseket választó ellenfeleket. További cél imitációs tanulással egy professzionális ágens létrehozása, amely egy pókerezni tudó ember lépéseit tanulja meg. A dolgozat végső lépése egy Unity alapú vizuális környezet létrehozása, amelyen segítségével grafikusan is látható, hogy a fejlesztett ágens milyen adatok alapján hozza meg a döntését. Ez a projekt egyszerre szolgálja a mesterséges intelligencia kutatását és annak gyakorlati alkalmazását egy összetett, nem teljesinformációs játékkörnyezetben.

Kulcsszavak

Megerősítéses tanulás, póker

Hivatkozás

https://hdl.handle.net/2437/394803

Gyűjtemények

Hallgatói dolgozatok (Informatikai Kar)

A tétel részletes nézete