Faster R-CNN generalizált kvantálása

Dátum
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

A Faster Region-based Convolutional Network (Faster R-CNN) hatékony objektumdetektáló modell, azonban nagy mérete és jelentős számítási kapacitásigénye korlátozza alkalmazhatóságát beágyazott rendszerekben és valós idejű környezetekben. A kvantálás bevált módszerek a modellek méretének és számítási igényének csökkentésére, azonban a Faster R-CNN teljes körű kvantálására jelenleg nem létezik nyílt forráskódú általános implementáció. Ennek legfőbb oka, hogy az architektúra egyes komponenseit azok szerkezeti sajátosságai miatt külön-külön szükséges kvantálni. Dolgozatunkban bemutatunk egy általános Faster R-CNN kvantáló algoritmust, amelyhez készített implementációnk nyílt forráskódú és kompatibilis a PyTorch ökoszisztémájával. Megoldásunk 67,2%-kal csökkenti a modell méretét és 50,4%-kal redukálja az észlelési időt, miközben a tesztadatokon mért pontosságot 8,2%-os hibahatáron belül ± 3,4% szórással megtartja. Eredményeink igazolják, hogy a javasolt módszer hatékonyan alkalmazható a Faster R-CNN teljes körű kvantálására, ezáltal lehetőséget teremt a modell alacsony fogyasztású hardvereken való futtatására. Ez különösen fontos olyan alkalmazásokban, mint az önvezető járművek, beágyazott szenzorrendszerek és valós idejű biztonsági megfigyelés, ahol a gyors és energiahatékony objektumdetektálás kulcsfontosságú.

Leírás
Kulcsszavak
kvantálás
Forrás