Advances in the theory and applications of (dis)similarity functions in pattern recognition

Dátum
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

A mintázatfelismeréshez (pattern recognition) kapcsolódó alkalmazások többségében megjelenik a hasonlóság fogalma: a valós világ számvektorokkal jellemezhető objektumainak egyfajta hasonlóságát kell meghatároznunk. Ehhez kapcsolódóan a hasonlóságot jellemzően vektorokon operáló ún. hasonlósági függvények / hasonlósági mértékek formájában definiáljuk. Természetesen az, hogy mit tekintünk hasonlónak, vagy éppen különbözőnek, általában a problémától, illetve az alkalmazási területtől függ. Mindazonáltal a legtöbb hasonlósági függvénynek van egy közös tulajdonsága: invariánsak a vektorok bizonyos transzformációival szemben. Például arcfelismerést megvalósító alkalmazásokban -- amelyek ma már az emberi érzékeléssel összemérhető teljesítményre képesek -- a hasonlóság mérőszámának invariánsnak kell lennie a képek alul- vagy éppen túlexponált jellegére, additív zajokra, geometriai- és színtranszformációkra, mivel egy bizonyos pontig ezen transzformációk megőrzik az alkalmazás szempontjából lényeges tartalmat: az arcot. A gyakorlatban jellemzően a probléma és az alkalmazási terület határozza meg, hogy mely transzformációkkal szemben kell a hasonlósági függvénynek -- a lehetőségekhez mérten -- invariánsnak lennie. Ha az objektumokat leíró vektorok koordinátáit hasonlóan értelmezhetjük (például egy kép minden pixele egy intenzitásinformációt hordoz, egy árfolyam idősor minden eleme egy árat jelent), jól használhatók azon hasonlósági függvények, melyek valamely nagy függvényosztályra nézve invariánsak, például a lineáris vagy sima, de nem-lineáris, monoton vagy nem-monoton transzformációkra. Ennek megfelelően a bizonyos transzformációosztályokra invariáns hasonlósági függvények elméletében, illetve a hasonlósági függvények újszerű alkalmazásaiban elért eredmények a mintázatfelismeréshez kapcsolódó számos területen találhatnak alkalmazásra. A dolgozatban bizonyos transzformációosztályokra invariáns hasonlósági függvényekhez kapcsolódó új eredményeket, illetve hasonlósági függvények újszerű alkalmazási lehetőségeit ismertetjük.


Deep under the hood, most of the pattern recognition driven applications are built on the concept of measuring the similarity or the inversely proportional dissimilarity of real world objects described by numerical vectors. Correspondingly, similarity and dissimilarity are usually formulated in terms of mathematical functions operating on vectors. Obviously, what similar and dissimilar mean, depends on the field of application. As a common property, (dis)similarity functions are usually desired to be invariant to some certain classes of transformations. For example, in face recognition applications -- having similar performance as human mind -- the (dis)similarity measure is desired to be invariant to under- and over-exposure, noise, geometric and color space transformation, since up to a limit these distortions conserve the piece of information important from the application's point of view: the face. In pattern recognition, the requirements of the application define which transformations the (dis)similarity measure has to be invariant to, and the invariance implies that the information (pattern) is conserved under this class of transformations. If the coordinates of the vectors can be interpreted similarly (e.g. all pixels of a grayscale image represent intensity levels; all elements of stock price time series are prices), the needs of most applications can be satisfied by (dis)similarity measures invariant to some general classes of transformations, like linear, non-linear, monotonic or non-monotonic ones. Consequently, the research of (dis)similarity measures invariant to some of these classes is of high value in various fields and applications of pattern recognition. In the dissertation some new theoretical results and some novel applications of (dis)similarity measures are described.

Leírás
Kulcsszavak
similarity measures, dissimilarity measures, monotonic tone mappings, kernel trick, hasonlósági függvények, kernel trükk, monoton leképezések
Forrás