Sejtszegmentálás nagy felbontású mikroszkóp felvételeken
Absztrakt
A diplomamunkámban a női méhnyakrák-szűrések folyamán készült képek automatizált elemzésével fogok foglalkozni. Ez napjainkban is rendkívül bonyolult témakör, amellyel rengeteg tanulmány foglalkozott már korábban. A legtöbb kutatás – mint ahogy az általam feldolgozott kutatás is –az ISBI 20141 felügyelete alatt meghirdetett Overlapping Cervical Cytology Image Segmentation Challenge nevezetű verseny alkalmával jött létre. Több nehézség is megnehezíti a feladatot, mint például a képeknek a hatalmas mérete, a szennyezettsége, illetve az, hogy a vizsgált objektumok egymást fedik át, így nehezítve az azonosításukat. Örülök, hogy ezt a témát választottam diplomamunkám témájaként, hiszen rengeteg érdekességet tanultam meg a kutatómunka és a fejlesztés során, elmélyültem a képfeldolgozásban és magának a Pap Smear tesztnek2 a működésében. Különböző képfeldolgozási módszereket, eljárásokat tanulmányoztam át, illetve a MATLAB programozási nyelvvel mélyebbre hatóan megismerkedhettem, amelyet a diplomamunkám során írt algoritmus nyelvének választottam. Maga a téma egészségügyi szempontokból kiemelten fontos, hiszen a rákos megbetegedések korai felismerésével rengeteg életet meg lehetne menteni. A diplomamunkám során a célom az, hogy olyan algoritmust alkossak meg, amelyet későbbi párhuzamosítások során sikeresen lehet alkalmazni a Pap smear vizsgálat során készült képeken nukleuszok és sejtek szegmentációjára. Célszerű az algoritmust C++ nyelvben is megvalósítani, mivel így könnyen párhuzamossá lehetne tenni. A megvalósítás után szuperszámítógépes környezetben lehetne a programot futtatni, így gyorsan, pontosan tudná szegmentálni a nukleuszokat3. Jelenleg az algoritmust nem C++, hanem a MATLAB programozási nyelven valósítottam meg, a nyelvválasztásom okairól a 2.2 fejezetben lehet bővebben olvasni. Az elkészített algoritmus segítségével a női méhnyakrák szűrések során készült vizsgálati képeken végzem a sejtek és a sejtmagoknak a szegmentálását. Sajnos magának a vizsgálatnak a tulajdonságaiból adódóan a sejtek azonosítása gyakran nem lehetséges, hiszen a teszt során a sejtek könnyedén sérülhetnek. Ez a probléma megnehezíti az így is bonyolult feladatot. A diplomamunka során Ash Gençtav, Selim Aksoy és Sevgen Önder korábbi tanulmányát dolgozom fel, amelynek a címe a következő: Unsupervised Segmentation and Classification of Cervical Cell Images. A dolgozat során először a kapcsolódó biológiai (2.1) és számítástechnikai ismereteket – a programozási nyelvet (2.2), az általam használt képfeldolgozási módszereket (2.3), illetve magának az osztályozásnak a folyamatát (2.4) – mutatom be, ezekről a 2. fejezetben lehet részletesen olvasni. Ezután a korábban említett kutatási versenyt mutatom be a 3. fejezetben, ahol bemutatok pár darab olyan – általam fel nem dolgozott – tanulmányt, amit ez a verseny ihletett (3.2). Ezután rátérek az általam megvalósított algoritmus részletes bemutatására a 4. fejezetben. Az algoritmus első lépése az inputként kapott kép feldolgozása olyan módon, hogy kinyerjük belőle a vizsgálandó objektumokat (4.2.1). Ehhez rengeteg képfeldolgozási műveletet használtam fel. Az algoritmust az egyes objektumokra kell végrehajtani. A feldolgozott szakmai anyag az vizsgált objektumot részeire bontotta, próbálta megkeresni az objektum egybefüggő területeit (4.2.2.1) a többszintű vízválasztó algoritmus felhasználásával. A megtalált területeket ezek után osztályoztam három osztályba, amelyek a következők voltak: nukleusz, sejt, háttér (4.2.2.2). A nukleuszként azonosított részekre ezután lefuttattam a saját fejlesztésű algoritmusomat (4.2.2.3), amely az adott részobjektum pixelértékei által meghatározott hisztogram legerősebb lokális minimuma alapján rekurzívan két részre bontotta. Az új részobjektumokat újraosztályoztam. Az algoritmus futási eredményeit 5 darab képben mutatja be, amelyek a 4.2.2.4 részben lesznek részletesen bemutatva.