Osztályozási módszerek az adatbányászatban
Absztrakt
Szakdolgozatom témája az „Adatbányászati alkalmazások fejlesztése a RapidMinerben. A RapidMiner számos eszközt biztosít adatbányászati eljárások beágyazására más rendszerekbe. A téma ezek áttekintése és egy konkrét megvalósítása." Az adatbányászat hatalmas témakör ezért a szakdolgozatom címe az „Osztályozási módszerek az adatbányászatban" lett. Azért választottam ezt a témát, mert fontosnak és időszerűnek tartom, mivel a mai felgyorsult világban hatalmas mennyiségű információ zúdul ránk. „Rengeteg adat gyűlik össze és raktározódik el adattárházakban", mint például, webes és e-kereskedelmi adatok, bank és hitelkártya tranzakciók, statisztikai adatok stb. „Az adat maga az információ, a közlés, a hír, azaz maga az elemi ismeret", amely körülvesz minket és befolyásolja életünket. Dolgozatom tartalma: Adatbányászat fogalma, területei, fontossága. Az adatok előfeldolgozására használatos eljárások. Az osztályozási módszerek hét típusa amelyek a következők: döntési fák, szabály alapú módszerek, memória alapú módszerek, logisztikus regresszió, neurális hálók, Bayes módszer és az SVM elmélete. Bináris fa osztályozási eljárás bemutatása gyakorlati feladaton keresztül.