Textúra analízis alkalmazhatósága orvosi képeken

Absztrakt

A textúra analízis módszerei kiegészítő kvantitatív információt nyújthatnak az orvosi képek kiértékelésében, melyek segítségünkre lehetnek az összehasonlító vizsgálatokban, az egészséges és kóros területek elkülönítésében, illetve a terápiák tervezésében és nyomon-követésben is. Az elmúlt évtizedben kiemelkedő törekvéssé és céllá vált (radiomics) az orvosi képalkotás folyamatában, hogy minél több plusz információ és számszerű adat álljon rendelkezésre az elkészült vizsgálati képanyagból. Kutatásunkban három textúra analízishez kapcsolódó problémakört vizsgáltunk:

  1. Nem tisztázott, hogy a TA számoló szoftverek mennyire egyforma eredményt adnak az egyes textúra indexekre vonatkozóan.
  2. Az irodalomban számos esetben merült már fel kérdésként, hogy a TA milyen esetekben alkalmazható a differenciál diagnosztikában, illetve, hogy az analizálandó terület alakja mennyire befolyásolja a kapott eredményeket.
  3. FDG-PET képeken végzett heterogenitás analízis esetén a kezdeti lépésként alkalmazott diszkretizáció szerepének vizsgálata. Milyen hatása van az AR (absolute resampling), a LAR (lesion absolute resampling) és az LRR (lesion relative resampling) diszkretizációs módszereknek a számolt radiomics adatokra? A szintetikus képeken alapuló szoftver összehasonlítása kapcsán bemutattuk, hogy a konkrét TI számolási algoritmusok általában nem egyeztek meg a kiválasztott szoftverekben (Matlab, MaZda, CGITA és InterviewFusion). Néhány textúra paraméter értéke, bizonyos szoftvereknél, jelentősen (akár több mint 100%-kal) eltér a többitől, illetve a „gold standard”-nak vett manuális kiértékelés eredményétől. Sajnos a programoknál nem minden esetben ismeretes az implementált matematikai képlet, továbbá az alkalmazott GLCM irányok és átlagolásuk sem minden esetben egyértelmű. Ez nem azt jelenti, hogy valamelyik szoftver jobb lenne vagy rosszabb, hiszen a textúra indexeknek sincs mindenki által elfogadott egységes definíciós képletrendszere, hanem azt, hogy a különböző heterogenitás számolásra használható programok nem ekvivalensek. Így, ha egy radiológus mindig ugyanazt a kiértékelő szoftvert használja az ugyanolyan protokollal készült képeken, akkor az így végzett textúra analízisek eredményei alapvetően megbízhatóak és összehasonlíthatóak lehetnek. Az azonos alakú, de eltérő tartalmú képek TI értékei igen hasonlóak lehetnek, így nem minden textúra index alkalmas a képek elkülönítésére. Az Ádám teremtése című freskó és egy szövettani agyi kép segítségével bemutattuk, hogy a számolt textúra indexek esetén csak 5 paraméterre (autokorreláció, klaszter árnyékolás, négyzetes-, variancia- és átlag-összeg) mondhatjuk, hogy az alacsony zajú képek (festmények, fényképek) elkülönítésére használhatóak. Illetve az újra-mintavételezés esetén legalább a D=64 bin értéket kell választanunk, hogy a TI-k biztonsággal alkalmazhatóak legyenek, vagyis ne függjenek a D értéktől jelentősen. A tüdőből és emlőből származó metasztázisok textúráinak összehasonlítása MRI képek vizsgálata alapján kijelenthető, hogy az LBP alapú TI-k érzékenyebbek voltak a metasztázisok eredetére, szemben az MR-T1 kontrasztos képeken számolt TI-kel. Továbbá a textúra indexek relevanciája függhet az alkalmazott 2D vagy 3D TA módszertől. Vizsgálatainkban a legígéretesebb textúra indexek az entropy és az energy voltak. Elmondható tehát, hogy a textúra indexek alkalmazásának az orvos-diagnosztikai képelemzések során gyakorlati jelentősége lehet. Az FDG/PET vizsgálatok segítségével végzett három eltérő diszkretizáció analízise kapcsán kijelenthető, hogy a különböző diszkretizációk a TI-k értékeit több mint 100%-kal is módosíthatják (D és B függés), így nem mindegy, hogy milyen bin értékkel, illetve bin szélességgel dolgozunk. Ezek az eredmények nem függtek a tumor szegmentálás (manuális vagy küszöb alapú) módjától és értékétől. A LAR és AR hasonló, de többlet információt adott minden számolás esetén az LRR újra-mintavételezéshez képest. Eredményeink rámutatnak arra, hogy az újra-mintavételezés módja alapvető hatással van a textúra analízisre, ezért fontos lenne egy protokoll szerinti egységes diszkretizálási módszer használata. Ismert tény, hogy az újra- mintavételezés jelentőségét főleg a kvantitatív skálájú PET területén vizsgálták idáig, így további kutatások szükségesek a megfelelő diszkretizálási algoritmusok kidolgozásához más szemikvantitatív és nem kvantitatív modalitású képek (például CT, MRI és UH) esetén is.

Methods of texture analysis (TA) may provide further quantitative information on the evaluation of medical images, which can help us with comparative studies, with the classification of healthy and pathological areas, and to design and monitor therapies. Over the past decade, it has become a key objective in the medical imaging process to provide as much additional information and numerical data as possible from the medical images. In our research, we investigated three problems related to texture analysis:

  1. It is unclear whether different software packages produce the same results for each texture index.
  2. Published papers have raised the question of how TA analysis can be used in differential diagnostics, and how the shape of the investigated area (lesion) may affect the results.
  3. We investigated the role of initial discretization methods in the heterogeneity analysis of FDG PET images. What is the effect of absolute resampling (AR), lesion absolute resampling (LAR) and lesion relative resampling (LRR) sampling methods on the computed radiomics data?

When comparing software-based texture indices (TI) on synthetic images, we demonstrated that specific TI calculation algorithms were generally not the same in the selected software packages (Matlab, MaZda, CGITA, and InterviewFusion). The values of some texture parameters obtained by various programs were significantly different (up to 100%) from the others and from the result of manual evaluation as "gold standard". The explanation for the discrepant results is that the implemented mathematical formulae are not always known, and the applied GLCM directions and averaging methods are not always clear. This does not mean that any software is better or worse than the others, since texture indices do not have a generally accepted definition; it just indicates that the different programs for heterogeneity calculation are not equivalent. Thus, if a radiologist always uses the same evaluation software for images acquired with the same protocol, the results of texture analysis can be fundamentally reliable and comparable.

Images showing the same shapes but different contents may have very similar TI values, so not all texture indices can distinguish between pathologies. By comparing the fresco of Adam's creation and a histological brain slice, we demonstrated that from among the computed texture indices, only 5 parameters (autocorrelation, cluster shading, sum of squares, sum of variance, and sum of mean) can be used to classify low-noise images (paintings, photographs). In the case of re-sampling, at least D = 64 bin values are necessary for the TIs not to depend on the D value. When comparing the textures in MRI images of lung and breast metastases, we found that the LBP-based TIs were more sensitive to the origin of metastases than TIs calculated from MR-T1 post-contrast images. Furthermore, the relevance of the texture indices may depend on the 2D or 3D TA method used. The most promising texture indices in our study were entropy and energy. Our results support that the use of texture indices in medical diagnostic image analysis may be of practical importance.

When applying three different discretization (normalisation) methods to FDG-PET images, we found that the way of discretization can change the values of TIs by more than 100% (dependence on D and B), so care should be taken when selecting the number and width of bins. These results were independent of the tumour segmentation methods (manual or threshold-based). LAR and AR provided similar but additional information for each calculation as compared to LRR resampling. Our results indicate that the method of resampling has a fundamental effect on texture analysis, so it would be important to use a uniform resampling protocol. So far the significance of resampling has mainly been investigated in the field of quantitative PET, so further research is needed to develop appropriate discretization algorithms for other semi-quantitative and non-quantitative imaging modalities (such as CT, MRI, and US).

Leírás
Kulcsszavak
textúra analízis, texture analysis, fantom mérés, tumor, diszkretizáció, Radiomics, phantom measurement, tumour, discretization
Forrás