A Reddit közösségi fórumon megosztott bejegyzések polaritásának elemzése és prediktálása gépi tanulási eszközökkel
Absztrakt
Szakdolgozatom a Reddit közösségi fórum bejegyzéseinek hangulatelemzéséről és gépi tanulási eszközökkel ezen hangulatok prediktálásáról szól. Bemutatom a szövegbányászattal kapcsolatos alapvető információkat, felhasználási területeit és folyamatát. Továbbá betekintést nyújtok a természetes nyelvek feldolgozásának folyamatába és az arra épülő Vader szentimentelemző eszköz működésébe. Ismertetem a Reddit közösségi fórum felépítését, bejegyzéseinek és hozzászólásainak egyedi sorrendezését és algoritmusát, valamint a posztok különböző típusait is. A dolgozat másik részében prezentálom a hangulatelemzéssel kapott eredményeket, mind a bejegyzések címeinél, mind a hozzájuk fűzött kommenteknél. Legvégül a demonstrálom a gépi tanulással elvégzett és elért megoldásokat.