Téma az adatbányászat területéről – A k-nn algoritmus és implementálása

Dátum
2012-05-07T06:52:06Z
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

A dolgozatban az adatbányászat rövid, de átfogó bevezetését követően a k-legközelebbi szomszéd osztályozó algoritmus kerül bemutatásra egy implementáción keresztül. Bemutatásra kerül az adatbányászat, mint tudományterület, legfontosabb kérdései, a megoldandó problémák és kihívások. Ezt követően az osztályozásról és a k-nn algoritmusról esik szó, kitérve az összehasonlításhoz használt távolság mértékekre is. A dolgozat második felében a k-nn algoritmus általam megvalósított Java nyelvben írt implementációját mutatom be. Az implementáció több részre van bontva, mint például adatbeolvasás/kiírás, adatreprezentáció, normalizálás, távolság mértékek, osztályozás, ezen belül a k-nn algoritmus, teljesítmény mérés.

Leírás
Kulcsszavak
adatbányászat, osztályozás, klasszifikáció, k-nn algoritmus, k-legközelebbi szomszéd algoritmus, távolság mértékek, z-transzformáció
Forrás