Robot tárgy- és mozgásfelismerés egy kamerával

Dátum
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

Kutatásunk fő célja az egyetemen humanoid robot építésben való közreműködés. Ebben a robot kamerájának tárgy- és mozgásfelismerő funkcióinak lehetőségei, annak problémájának megoldásai és ezek implementációja jelentették számunkra a munka alapját. A legfőbb kihívást a korlátozott hardveres erőforrások, mint a Raspberry Pi és annak egykamerás modulja adták.

A blokkillesztő algoritmus lényege, hogy a videó képkockákat makroblokkokra osztja fel. Ezeket a makroblokkokat hasonlítja össze az adott algoritmus által meghatározott módon, hogy megállapítsa, egy adott makroblokk a következő képkockán belül hol található. Kutatásunk része volt a különböző blokkillesztő algoritmusok vizsgálata, az optimális kiválasztása és implementációja a mozgásfelismerés megvalósításához.

A TensorFlow egy ingyenes, nyílt forráskódú, népszerű gépi tanulás és mesterséges intelligencia szoftverkönyvtár, melyet gyakran használnak mélytanuló hálózatokhoz. Dolgozatunk része a TensorFlow korlátozott hardveres erőforrásokon tárgyfelismerésre használatának optimalizációs lehetőségeinek vizsgálata. A Raspberry Pi egy bankkártya méretű számítógép, mely a leendő humanoid robot agyaként fog funkcionálni.

A blokkillesztő algoritmusok több évtizedes múltra tekintenek vissza, a TensorFlow szoftverkönyvtár közel 7 éve érhető el, azonban szabadon hozzáférhető, nyílt forráskódú, Raspberry Pi-ra optimalizált kombinációja a két technológiának általunk nem volt fellelhető. Gyakorlati haszna azonban már az egyetemi kutatás során is lesz. Implementációnk Raspberry Pi-ra tervezve kombinálja a TensorFlow általi tárgyfelismerést és különböző blokkillesztő algoritmusokat. Az egyes felismert tárgyakat címkézzük aszerint, éppen mozgásban vannak-e. Eredményeink igazolására dokumentumunk az általunk végzett teszteket is tartalmazza.

Leírás
Kulcsszavak
robot, tensorflow, blokkillesztő, kamera
Forrás