Fazekas, IstvánUrr, Beáta2006-08-032006-08-0320052006-08-03http://hdl.handle.net/2437/357A többváltozós statisztikai vizsgálatok egyik jellegzetes feladata az osztályozás. Az alak-felismerési és osztályozási módszereket széles körben lehet a gyakorlati problémáknál alkalmazni. Az alapfeladat az, hogy N változóval jelzett objektumokat, ún. alakzatvektorokat adott kategóriák (osztályok) valamelyikéhez soroljuk. Szemléltessük néhány tipikus alak-felismerési feladatot: ² Betu felismerés. Ezt a feladatot oldják meg a postai levél osztályozó automaták. ² Ujjlenyomat azonosítása a bunügyi archívumban. ² Valamilyen termék minoségének besorolása. ² Többsávos muhold felvétel képpontjainak felismerése, azaz a képpont és a neki megfelelo földszíni objektum (pl. vízfelület, település) összekapcsolása. Az alak-felismerési problémáknál a felismerendo (osztályozandó) objektumokat olyan változókkal jellemezzük, amelyek feltehetoen kapcsolatban 3 Bevezetés vannak az elore definiált kategóriákkal. Az osztályozandó objektumokat számkomponensu vektorral adjuk meg. Ez az „objektum!vektor” hozzárendelést lényegkiemelésnek nevezzük. A lényegkiemelés az alakfelismerés folyamatában az az alapveto fontosságú lépés, amikor a kategóriákkal leginkább összefüggo változókat választjuk ki illetve, amikor olyan transzformációt hajtunk végre, ahol az objektumok jobban szeparálódnak az egyes osztályok szerint. A lényegkiemelésnek általános matematika elmélete még nincs, minden konkrét osztályozási feladatban az objektumok gondos elemzése útján kell a vizsgálat tárgyát leíró vektort kialakítani. A meteorológiai és geofizikai megfigyelések esetén például gyakran alkalmaznak sorfejtéseket, és a sorfejtések együtthatói alkotják az objektumot leíró vektor komponenseit. Más esetben az objektumok jellegzetes tulajdonságainak méroszámai (életkor, súly,...) lesznek a vektor komponensei. Mindenesetre fontos, hogy a vektor dimenziója ne legyen túl nagy. Gyakran elofordul, hogy az osztályozási feladat megoldása során mind az algoritmust (osztályozási módszert), mind a lényegkiemelést többször változtatjuk, kísérletezünk vele. Dolgozatomban eloször ismertetem a jól ismert módszereket és azok elméleti hátterét. A Bayes-döntésre, a diszkriminancia analízisére, a legközelebbi társ módszerre és a klaszteranalízis néhány eljárására térek ki. Ezután felsorolom a Matlab osztályozásra használatos függvényeit. Mindezeket a Fisher írisz mintapéldán is ismertetem.661418959 bytesapplication/pdfhuno_restrictionBayes-döntésdiszkriminancia analízistanulóalgoritmusokklaszteranalízisosztályozás a Matlab-banAz osztályozás statisztikai módszerei