A Valenbisi közösségi kerékpárkölcsönző rendszer adatainak elemzése klaszterezéssel és vizualizációval

Dátum
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

A kutatási témám keretében egy francia cég, a JCDecaux által Valenciában üzemeltetett kerékpármegosztó rendszer adatait elemeztem. A kutatásom célja az volt, hogy a kerékpártárolókat két különböző megközelítésből vizsgáljam, egyrészt a napi használatuk, másrészt pedig a környezetükben elhelyezkedő létesítmények alapján. Arra kerestem a választ, hogy a két megközelítés szerint klaszterezve az adatokat milyen átfedés található az eredmények között, azaz mennyire lehet hasonló csoportokba sorolni az egyes tárolókat, van-e összefüggés a tárolók használata és a telepítésük helye között. A JCDecaux összes valenciai tárolójának percenként mintavételezett nyers adatait egy Python szkriptet használva szűrtem, majd meghatároztam a tárolókban elérhető kerékpárok arányának óránkénti medián értékét. Az OpenStreetMap térképelemeit a címkéik alapján kategorizáltam, majd az Overpass API segítségével határoztam meg az egyes tárolók környezetében található címkék darabszámát. A klaszterezés során a Python pandas és scikit-learn könyvtárait használtam, az optimális klaszterezési módszer és előfeldolgozási lépés kiválasztása érdekében a silhouette score mérőszáma alapján ellenőriztem a csoportba sorolás következetességét, végül pedig a rand-index segítségével számszerűsítettem a két megközelítéssel létrehozott klasztercsoport hasonlóságát. Az eredmények szemléltetése érdekében egy Tableau-ban készült vizualizációt hoztam létre, amely bárki számára lehetővé teszi az adatok vizuális feltárását. Eredményeim alapján a tárolók napi kihasználtsága és a környezetükben található létesítmények típusai között összefüggés fedezhető fel, ennek megfelelően célszerű a leendő tárolók környezetét elemezni a telepítésük előtt, mely célból az OpenStreetMap adatai is felhasználhatók.

Leírás
Kulcsszavak
klaszterezés, adatvizualizáció, közösségi kerékpármegosztó rendszer, adatbányászat, Overpass API
Forrás