Nagy mennyiségű adatfeldolgozás - a társadalmi egyenlőtlenségek elemzése
Absztrakt
Szakdolgozatom során többféle eszközt mutatok be, amelyek alkalmasak nagy mennyiségű adat kezelésére. Elsőként definiálom, mi is az a Big Data, mikre érdemes odafigyelni feldolgozása során. Ezután fejezetenként egy-egy program használatba nyújtok betekintést. Kezdve a Tableau szoftverrel, melyben különböző vizualizációkat készítettem. Ezt követően az IBM SPSS Statistics használatáról ejtek néhány szót, itt bemutatok néhány statisztikai próbát. Ismertetem, melyiket mikor érdemes használni. Végül a Jupyter Notebook használatával Python programozási nyelven a különböző beépített modulok segítségével mutatok be különböző előrejelzésre alkalmas modelleket. Az adatok feldolgozásának módszereit úgy szemléltetem, hogy közben a társadalmi egyenlőtlenségeket vizsgálom, mivel úgy gondolom ez egy állandóan aktuális téma, amellyel folyamatosan foglalkozni kell.