felügyelt gépi tanulás kihívásai a szociológiai alkalmazásokban

Dátum
2021-09-30
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

The sociological applications of supervised machine learning, already well proven in industrial/ business applications, raise specific questions. The reason for this specificity is that in these applications, the algorithm is tasked with learning complex concepts (e.g. whether a tweet contains hate speech). Supervised learning consists of learning to classify previously annotated (hate speech/non-hate speech) texts by the algorithm, looking for characteristic text patterns. The questions that arise are: how to prepare annotation? How can a hermeneutic challenge such as hate speech recognition be performed by annotators? Are routinely applied, detailed annotation guidelines helpful? The article also discusses how large companies perform coding on crowdsourcing platforms, and describes AI bias, which in this case means that annotators themselves introduce bias into the data. I illustrate these issues with our own research experiences.


Az ipari/üzleti alkalmazásokban már sokszorosan bizonyított felügyelt gépi tanulás szociológiai alkalmazásai sajátos kérdéseket vetnek fel. A sajátosság oka, hogy ezekben az alkalmazásokban komplex fogalmak megtanulása az algoritmus feladata (pl. hogy gyűlöletbeszédet tartalmaz-e egy tweet). A felügyelt tanulás lényege, hogy előre bekódolt (gyűlöletbeszéd/nem gyűlöletbeszéd) szövegek címkézését tanulja meg az algoritmus, jellegzetes szövegmintázatokat keresve. A felmerülő kérdések: hogyan jön létre a címkézés? Hogyan lehet betanított kódolókkal elvégeztetni egy olyan hermeneutikai kihívást, mint a gyűlöletbeszéd felismerése? Segítenek-e ezen a rutinszerűen alkalmazott, részletezett annotálási irányelvek? A cikk arra is kitér, hogyan végzik crowdsourcing platformokon a kódolást a nagy cégek, illetve ismertetem az MI-torzítást is, aminek itt az a lényege, hogy a kódolók maguk viszik be a diszkriminációt az adatokba. E kérdéseket kutatási tapasztalatainkkal illusztrálom. KULCSSZAVAK: felügyelt gépi tanulás, annotálás, crows

Leírás
Kulcsszavak
Jogtulajdonos
METSZETEK - Társadalomtudományi folyóirat
URL
Jelzet
Egyéb azonosító
Forrás
Metszetek, Évf. 10 szám 3 (2021) , 27-42.
Támogatás