Developing Performant Neural Network Architectures for Processing Medical Data
Dátum
Szerzők
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt
A disszertációban számos újszerű módszer kerül bemutatásra a különféle mélytanuló modellek pontosságának és megbízhatóságának növelésére. A bemutatott módszereket különböző problémák megoldására alkalmazzuk a klinikai területen és ismertetjük azok előnyeit a hagyományos mélytanulás alapú megoldásokkal szemben. A disszertációban szereplő megoldások két csoportra oszthatók.
Az első csoportba tartozó eljárások a különböző hagyományos módszereket kombinálják a mélytanuló technikákkal annak érdekében, hogy javítsák a neurális hálók pontosságát. Ennek kapcsán megmutatjuk, hogy elő tudunk állítani olyan modelleket, amelyek mindkét megközelítés előnyeit magukban hordozzák. Az ilyen módon létrehozott modellek ugyanis nem csak kisebb adathalmazokon képesek működni, de robusztusabbak és rugalmasabbak is, mint a hagyományos módszerek. A disszertációban két probléma esetében vizsgáljuk a hagyományos és mélytanulás alapú módszerek ötvözésének lehetőségét. Először egy kétlépcsős architektúrát mutatunk be, melynek célja az elméleti modellek és a neurális hálók hatékony fúziója és alkalmazzuk azt az influenza, valamint COVID-19 terjedésének előrejelzésére. Ezt követően ismertetünk egy módszert, amely képes ötvözni a hagyományos képfeldolgozással és a konvolúciós neurális hálók által kinyert jellemzőket. A módszer több változatát is ismertetjük ezen jellemzők hatékony kombinálásának érdekében, majd pedig használjuk azokat a diabéteszes retinopátia és a diabéteszes makulaödéma felismerésére.
A disszertációban ismertetett módszerek második csoportjának célja olyan hatékony ensemble modellek kifejlesztése, amelyek pontosabbak és hatékonyabbak a hagyományos megközelítéseknél. Ennek kapcsán először egy egyedi megközelítést mutatunk be a sejtek digitalizált Pap keneteken történő hatékony szegmentálására. A módszer egy teljesen konvolúciós neurális hálót (FCN) alkalmaz és egyszerre dolgozza fel mind további betanított FCN modellek bemeneteit, mind pedig az eredeti bemeneti képet. Ezt követően a diverz ensemble modellek építésének problémáját mutatjuk be. Kitérünk arra, hogy a hagyományos módszerek nem veszik figyelembe az együttes diverzitását, azaz, hogy a tagmodellek mennyire különbözőek. Ezután több újszerű, ensemble alapú megközelítést mutatunk be, melyek a tanítás során a tagmodellek utolsó konvolúciós rétegei által kinyert jellemzők közötti hasonlóságot egyfajta regularizációként használják. A módszer több változatát is ismertetjük és alkalmazzuk azokat az agydaganatok MRI felvételeken történő pontos osztályozására.
In this dissertation, several novel methods are presented for improving the accuracy and reliability of various deep learning models. We apply these methods to solve various problems in the clinical domain and describe their advantages over traditional deep learning-based solutions. The solutions presented in this dissertation can be divided into two groups.
The first group of methods combines various traditional methods with deep learning techniques in order to improve the accuracy of neural networks. In this context, we show that we can devise models that combine the advantages of both approaches. Models created in this way are not only able to operate on smaller datasets, but are also more robust and flexible than traditional methods. In this thesis, we explore the possibility of combining traditional and deep learning-based methods for two problems. First, we present a two-stage architecture for the efficient fusion of theoretical models and neural networks, and apply it to predict the spread of influenza and COVID-19. We then describe a method that is able to combine hand-crafted features with those extracted by convolutional neural networks. We describe several variants of the method to combine these features efficiently, and then use them to detect diabetic retinopathy and diabetic macular edema.
The second set of methods described in this thesis aims to develop efficient ensemble models that are more accurate and efficient than traditional approaches. In this context, we first present a unique approach for the efficient segmentation of cells on digitized Pap smear images. The method employs a fully convolutional neural network (FCN) and simultaneously processes both the inputs from additional pre-trained FCN models and the original input image. Then, we present the problem of building diverse ensemble models. We point out that traditional methods do not take into account the diversity of the ensemble, i.e., how diverse the member models are. Then, we present several novel ensemble-based approaches that use the similarity between the features extracted by the last convolutional layers of the member models as a form of regularization during training. Several variants of the method are described and applied to accurately classify brain tumors in MRI images.