Párhuzamos adatbányászat Cython-OpenMP segítségével
Absztrakt
A diplomamunka során három adatbányászati alapfeladatot implementálok (csoportosítás, osztályozás, társítási szabályok keresése)Python programozási nyelvben, majd vizsgálom a Cythonnal, OpenMP-vel való gyorsítási lehetőségek közül melyek alkalmazhatóak és milyen sikerrel. A Cython egy C nyelvű kiterjesztése a Python programozási nyelvnek. Használata során a Cython fordító segítségével hatékony C vagy C++ forráskódot állítunk elő a Python kódunkból. Az Open MultiProcessing szabvány osztott memória modell alapú párhuzamos programozást támogató eszközöket specifikál. A dolgozat céljának azt a kérdést tűztem ki, hogy érdemes-e a Cython valamint az általa elérhetővé vált OpenMP lehetőségeit alkalmazni tetszőleges adatbányászati folyamatok során. Érdemes-e alapvető módosításokkal ezeket a technológiákat bármilyen Pythonban megírt kódra alkalmazni?