Developing Robust AI Techniques in Computer Vision

dc.contributor.advisorHajdu, András
dc.contributor.authorBeregi-Kovács, Marcell
dc.contributor.authorvariantBeregi-Kovács, Marcell
dc.contributor.departmentMatematika- és számítástudományok doktori iskolahu
dc.contributor.submitterdepTermészettudományi és Technológiai Kar::Matematikai Intézet::Algebra és Számelmélet Tanszék
dc.date.accessioned2025-08-30T11:15:27Z
dc.date.available2025-08-30T11:15:27Z
dc.date.defended2025-10-01
dc.date.issued2025
dc.description.abstractA számítógépes látás területén az utóbbi években jelentős fejlődést hoztak a mély neurális hálózatok, ugyanakkor a valós környezetben való alkalmazásuk számos kihívást rejt. E disszertáció két alapvető problémára ad megoldási javaslatot: (i) a konvolúciós neurális hálózatok (CNN-ek) robusztusságának növelése ensemble módszereken keresztül, valamint (ii) fizikai alapú szintetikus ködmodellezés kidolgozása a valósághű adatkiegészítés érdekében. Az első kutatási irány egy új ensemble keretrendszert vezet be, amely a taghálózatokat együttesen, korrelációbüntetéssel egészített veszteségfüggvény segítségével tanítja. A Pearson-féle korreláción alapuló regularizáció célja, hogy csökkentse a hálózatok közötti redundáns hibákat, miközben megőrzi a helyes klasszifikációkban mutatott egyetértést. A javasolt módszer mind természetes, mind orvosi képadatbázisokon következetesen jobb teljesítményt ért el a klasszikus ensemble stratégiáknál, különösen az out-of-distribution helyzetekben. A második kutatási irány egy diszkretizált Radiatív Transzfer Egyenleten (RTE) alapuló képszintézis-eljárást mutat be, amely inhomogén, anizotróp szórású köd hatásait képes modellezni. A tensor-alapú implementáció jelentősen csökkenti a számítási költségeket, miközben megőrzi a fizikai konzisztenciát. A módszer összehasonlító kísérletekben szisztematikusan felülmúlta a hagyományos (Koschmieder-típusú) és GAN-alapú ködgenerálási technikákat perceptuális hasonlóság, strukturális hűség és statisztikai realizmus szempontjából. A disszertáció két, látszólag független, de egymást kiegészítő hozzájárulása közös célt szolgál: a számítógépes látórendszerek megbízhatóságának növelését bizonytalan és degradált környezetekben. Az eredmények jelentős módszertani előrelépést képviselnek mind az ensemble tanulás, mind a fizikai alapú képszintézis területén, és széles körű alkalmazási lehetőségeket kínálnak az orvosi diagnosztikától az autonóm közlekedésig.
dc.description.abstractIn recent years, deep neural networks have driven major advances in computer vision, yet their deployment in real-world scenarios remains challenging. This dissertation addresses two key limitations: (i) the robustness of convolutional neural networks (CNNs) through ensemble learning, and (ii) the lack of physically realistic synthetic data under adverse environmental conditions, specifically fog. The first research direction introduces a novel ensemble framework in which CNNs are trained jointly using a loss function augmented with a Pearson correlation-based penalty. This regularization discourages redundant misclassifications while preserving agreement on correct predictions, thereby enhancing functional diversity. Extensive experiments on natural and clinical image datasets demonstrate that the proposed method consistently outperforms classical ensemble strategies, particularly in out-of-distribution scenarios, yielding ensembles that are both more accurate and more resilient. The second research direction develops a physics-inspired fog synthesis method based on a discretized Radiative Transfer Equation (RTE). This approach models inhomogeneous media with anisotropic scattering and is implemented using tensorized operations for computational efficiency. Comparative experiments confirm that the RTE-based method surpasses both traditional Koschmieder-type formulations and GAN-based approaches in terms of perceptual similarity, structural fidelity, and distributional realism. Although distinct, these two contributions share a common objective: improving the dependability of computer vision systems under uncertainty and degradation. Together, they advance the methodological foundations of ensemble learning and physically grounded image synthesis, offering valuable tools for applications ranging from medical imaging to autonomous driving.
dc.format.extent109
dc.identifier.urihttps://hdl.handle.net/2437/397138
dc.language.isoen
dc.language.isohu
dc.subjectszámítógépes látás, mesterséges intelligencia, konvolúciós neurális hálózat, ensemble tanulás, korrelációbüntetés, modellrobosztusság, adatkiegészítés, radiatív transzfer egyenlet, szintetikus ködmodellezés, anizotróp szórás,
dc.subjectcomputer vision, artificial intelligence, convolutional neural networks, ensemble learning, correlation penalty, model robustness, data augmentation, radiative transfer equation, synthetic fog modeling, anisotropic scattering
dc.subject.disciplineMatematika- és számítástudományokhu
dc.subject.sciencefieldTermészettudományokhu
dc.titleDeveloping Robust AI Techniques in Computer Vision
dc.title.translatedRobusztus mesterségesintelligencia-technikák fejlesztése a számítógépes látásban
dc.typePhD, doktori értekezéshu
Fájlok
Eredeti köteg (ORIGINAL bundle)
Megjelenítve 1 - 2 (Összesen 2)
Nincs kép
Név:
disszertáció_BKM.pdf
Méret:
5.36 MB
Formátum:
Adobe Portable Document Format
Nincs kép
Név:
Tézis_füzet_HUN_ENG_BKM.pdf
Méret:
1.69 MB
Formátum:
Adobe Portable Document Format
Engedélyek köteg
Megjelenítve 1 - 1 (Összesen 1)
Nincs kép
Név:
license.txt
Méret:
1.93 KB
Formátum:
Item-specific license agreed upon to submission
Leírás: