王沛沛,宋曼莉,張文華,趙國樺,白潔,程敬亮
鄭州大學(xué)第一附屬醫(yī)院磁共振科,河南 鄭州 450052;*通信作者 程敬亮 cjr.chjl@vip.163.com
腦膠質(zhì)瘤是中樞神經(jīng)系統(tǒng)最常見的原發(fā)性腫瘤,具有易擴(kuò)散、復(fù)發(fā)及預(yù)后不良等特點(diǎn)[1]。MRI可準(zhǔn)確定位腫瘤位置,評(píng)估血-腦屏障損害程度及良惡性分級(jí),是診斷腦膠質(zhì)瘤的首選方法[2],但目前臨床僅局限于視覺或主觀定量評(píng)估來闡明影像學(xué)的變化。影像組學(xué)可通過智能影像分析技術(shù)獲取到肉眼無法識(shí)別的腫瘤深層次信息,輔助醫(yī)師做出精準(zhǔn)的決策和治療,有望在腫瘤臨床工作中發(fā)揮重要作用[3]。
盡管目前影像組學(xué)研究已較為成熟,但在很多流程優(yōu)化上仍有挑戰(zhàn),其中一個(gè)重要問題是如何提取穩(wěn)健性好且可重復(fù)的特征,圖像分割和感興趣區(qū)(ROI)的選取是關(guān)鍵一步,決定了組學(xué)特征的來源區(qū)域[4]。MRI膠質(zhì)瘤影像組學(xué)的紋理特征能夠較好地描述腫瘤的內(nèi)部特征,反映腫瘤的空間異質(zhì)性[5],既往研究中ROI選取策略有以液體衰減反轉(zhuǎn)恢復(fù)像(FLAIR)為主包含水腫和腫瘤實(shí)質(zhì)的病灶區(qū)域和以T1增強(qiáng)為主的腫瘤實(shí)質(zhì)區(qū)域,不同的選擇方案得到的紋理特征也具有差異。本研究擬探討常見MR序列下3種不同ROI選取方案得到的紋理特征的一致性,一致性高的特征認(rèn)為穩(wěn)健性好,這種特征可在臨床應(yīng)用中放心使用;一致性差的特征認(rèn)為穩(wěn)健性弱,這種特征在臨床使用中需謹(jǐn)慎。
1.1 數(shù)據(jù)來源 基于BraTS2017比賽(www.med.upenn.edu/sbia/brats2017.html)中提供的285例膠質(zhì)瘤MR數(shù)據(jù)[6],包括75例低級(jí)別膠質(zhì)瘤(low-grade glioma,LGG)(WHO Ⅰ~Ⅱ級(jí))和210例高級(jí)別膠質(zhì)瘤(high-grade glioma,HGG)(WHO Ⅲ~Ⅳ級(jí)),數(shù)據(jù)包含以下序列:T1WI、T2WI、T2 FLAIR和增強(qiáng)T1WI(T1c)。所有數(shù)據(jù)經(jīng)過統(tǒng)一預(yù)處理,包括去顱骨、配準(zhǔn)到統(tǒng)一模板、重建到分辨率為1 mm3且矩陣大小為240×240×155的三維矩陣中。
由4名影像醫(yī)師用統(tǒng)一標(biāo)準(zhǔn)勾畫ROI,并經(jīng)1名經(jīng)驗(yàn)豐富的神經(jīng)放射學(xué)專家審查,選取勾畫較好的2個(gè)ROI,剔除勾畫較差的2個(gè)ROI,若勾畫差異小,則取所勾畫ROI的重疊區(qū)域;若差異較大,則由專家做出最終決定。ROI勾畫標(biāo)準(zhǔn):強(qiáng)化區(qū)為在T1c上呈強(qiáng)化的區(qū)域;水腫區(qū)為在T2上高信號(hào)的瘤實(shí)質(zhì)外圍區(qū)域;壞死區(qū)為在T1上低信號(hào)、T2上高信號(hào)且T1c上未強(qiáng)化的區(qū)域;病灶區(qū)為在FLAIR上的異常信號(hào)區(qū)域。本研究根據(jù)勾畫的圖像定義了研究的3個(gè)ROI(圖1),①強(qiáng)化區(qū):僅包含強(qiáng)化區(qū)域,記為ROIET(紅色);②實(shí)質(zhì)區(qū):包含壞死區(qū)和強(qiáng)化區(qū),記為ROIcore(藍(lán)色);③病灶區(qū):包含強(qiáng)化、壞死、水腫等異常信號(hào)的區(qū)域,記為ROIwhole(綠色)。
圖1 3種ROI選取法及其3D示意圖。從左至右分別代表ROIET、ROIcore和ROIwhole,A、B、C為最大切面圖,D、E、F為其對(duì)應(yīng)的3D可視化圖
1.2 圖像預(yù)處理 不同機(jī)器、線圈及掃描協(xié)議等均會(huì)對(duì)圖像的對(duì)比度造成影響[7],為消除這些變量的影響,使特征在不同來源下具有可比性,對(duì)ROI進(jìn)行以下預(yù)處理:①剔除ROI內(nèi)灰度值在μ±3σ(μ為灰度均值,σ為標(biāo)準(zhǔn)差)范圍外的像素點(diǎn)[8]。②對(duì)于高階特征的計(jì)算,采用適合于MRI的Lloyd-Max量化算法[9]對(duì)圖像進(jìn)行灰階量化。預(yù)處理及特征提取過程基于Vallières等[10]編寫的工具包(https://github.com /mvallieres/radiomics/)在matlab2017b平臺(tái)上進(jìn)行。
1.3 統(tǒng)計(jì)學(xué)方法 采用SPSS 22.0軟件進(jìn)行統(tǒng)計(jì)分析。采用組內(nèi)相關(guān)系數(shù)(ICC)度量不同ROI選取方法對(duì)特征穩(wěn)健性的影響,根據(jù)研究目的選用two-way model,consistency模型[11],ICC值為0~1,ICC值越高,特征的穩(wěn)健性越好。根據(jù)Landis和Koch的建議,ICC≥0.80為一致性好,0.61~0.79為中等,0.41~0.60為一般,0.11~0.40為較低,<0.11為無一致性。本文計(jì)算了所有模態(tài)的全局組內(nèi)相關(guān)系數(shù)(ICCglobal)、不同水平的局部ICC如ICCFlair_HGG代表HGG在FLAIR序列的ICC。
為研究不同序列和腫瘤級(jí)別對(duì)紋理特征穩(wěn)健性的影響,使用多因素方差分析對(duì)兩種因素進(jìn)行評(píng)估,為比較不同類別紋理特征穩(wěn)健性的差異,使用單因素方差分析方法,多重比較使用SNK法,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。此外,對(duì)特征的分類性能進(jìn)行評(píng)估,選用Logistic回歸訓(xùn)練預(yù)測(cè)模型,并使用留一交叉驗(yàn)
2.1 不同序列和腫瘤級(jí)別上的紋理特征穩(wěn)健性的差異 計(jì)算不同MRI序列(FLAIR,T1,T1c,T2)和腫瘤級(jí)別(HGG和LGG)的60個(gè)紋理特征局部ICC,這2種因素及其交互作用下的特征ICC方差分析(表1)顯示:①不同序列的特征ICC差異有統(tǒng)計(jì)學(xué)意義(P<0.05);②不同腫瘤級(jí)別的特征ICC差異無統(tǒng)計(jì)學(xué)意義;③序列和腫瘤級(jí)別的交互作用對(duì)特征ICC有顯著影響。通過對(duì)比均值發(fā)現(xiàn)主要由T1c序列引起,將其剔除后再做方差分析,發(fā)現(xiàn)只有不同序列差異有統(tǒng)計(jì)學(xué)意義(P<0.05),腫瘤級(jí)別和交互作用影響因素差異均無統(tǒng)計(jì)學(xué)意義,因此,不同的腫瘤級(jí)別的特征ICC在T1c上有差異,其他序列無差異。對(duì)8個(gè)水平進(jìn)行兩兩比較得到3個(gè)子集,子集1:[T1-LGG,T1-HGG,F(xiàn)LAIR-HGG,F(xiàn)LAIR-LGG,T1c-LGG]>子集2:[T2-HGG,T2-LGG]>子集3:[T1c-HGG]。證法驗(yàn)證模型的預(yù)測(cè)能力。分類性能使用受試者工作特征(ROC)曲線下面積(AUC)、敏感度和特異度進(jìn)行評(píng)估。
表1 圖像模態(tài)和腫瘤級(jí)別2個(gè)影響因素下的方差分析結(jié)果
根據(jù)ICC值將特征穩(wěn)健性分為5個(gè)級(jí)別,繪制局部ICC所占百分比的堆疊柱狀圖(圖2),T1序列的特征一致性好的占比最高,F(xiàn)LAIR一致性中等以上的占比最高,T1c-HGG的一致性最差,T1c-LGG與T2模態(tài)類似,低于FLAIR與T1的一致性。
圖2 不同水平下ICC穩(wěn)健性分級(jí)所占百分比
2.2 紋理特征類型的穩(wěn)健性分析 為分析5種不同類型特征的穩(wěn)健性,繪制了所得3個(gè)子集的局部ICC和ICCglobal的箱線圖(圖3),ICCglobal和8個(gè)交叉水平的局部ICC單因素方差分析顯示,不同類型特征的ICC顯著不同,兩兩比較得到3個(gè)子集[GLCM,GLRLM,GLSZM]>[NGTDM]>[一階],綜上可得,針對(duì)不同的ROI選取,高階特征比一階特征受到的影響要小,高階特征中NGTDM受到的影響最大,即高階特征的穩(wěn)健性明顯優(yōu)于一階,高階中NGTDM穩(wěn)健性最差。最后,將8個(gè)局部水平下的最小ICC作為依據(jù)列出所研究的60個(gè)特征的穩(wěn)健性分級(jí)(表2),60個(gè)特征中:2個(gè)一致性好的特征(GLRLM-RLN和GLSZM-GLN),15個(gè)特征中等,22個(gè)特征一般,13個(gè)特征較低,8個(gè)特征無一致性。
表2 60個(gè)紋理特征名稱及其穩(wěn)健性
圖3 ICCglobal和3個(gè)子集的局部ICC的箱線圖
2.3 特征分類性能 根據(jù)ROC分析結(jié)果對(duì)所提取的特征進(jìn)行排序,共獲得6個(gè)分類性能較好(AUC>0.8)的特征(表3),這些特征均從T1c中提取獲得,從ROIwhole、ROIcore、ROIET選取法中提取到的特征分別有2個(gè)、1個(gè)、3個(gè)。排名靠前的特征主要反映腫瘤區(qū)域不均質(zhì)性的GLCM特征,以及反映腫瘤形態(tài)的一階特征。穩(wěn)健性較好的2個(gè)特征的平均分類性能如下:GLRLM-RLN的AUC為0.52,敏感度為0.79,特異度為0.37;GLSZM-GLN的AUC為0.54,敏感度為0.81,特異度為0.38。
表3 AUC>0.8的6個(gè)特征的分類性能
影像組學(xué)的紋理特征通常是從醫(yī)師勾畫腫瘤區(qū)域確定的ROI中提取得到,因此ROI是影像組學(xué)特征的區(qū)域來源,這是影像組學(xué)研究中的第一步,直接關(guān)系到后續(xù)分類及預(yù)測(cè)結(jié)果的可重復(fù)性和準(zhǔn)確性,目前在MR膠質(zhì)瘤研究中,ROI提取主要分為以FLAIR上病灶區(qū)域的標(biāo)準(zhǔn)和T1c上腫瘤實(shí)質(zhì)區(qū)域的標(biāo)準(zhǔn)[12],前者ROIwhole包含了更多的信息如水腫鈣化等,ROI的異質(zhì)性高,且完整包含了腫瘤的邊緣信息;后者研究區(qū)域更有針對(duì)性,其ROI異質(zhì)性相對(duì)低,有些研究基于增強(qiáng)圖像僅勾畫強(qiáng)化區(qū)域[13],有些則以增強(qiáng)圖像為主,同時(shí)結(jié)合其他模態(tài)勾畫整個(gè)腫瘤實(shí)質(zhì)區(qū)域[14],因此,將后者按強(qiáng)化及瘤實(shí)質(zhì)區(qū)域分為ROIET和ROIcore。
本研究對(duì)上述3種ROI選取方法在腦膠質(zhì)瘤MR圖像中所提取的紋理特征一致性進(jìn)行研究,結(jié)果發(fā)現(xiàn):①在所研究的60個(gè)特征中,從總體來看,有17個(gè)特征表現(xiàn)出中等及以上的穩(wěn)健性,這些特征均來自于高階特征,高階特征比一階特征的穩(wěn)健性好,理論上,一階特征反映ROI中像素灰度的一階分布信息和區(qū)域的整體信息,高階特征反映腫瘤內(nèi)部的異質(zhì)程度和紋理信息,而不同的ROI選取范圍對(duì)腫瘤內(nèi)部的紋理等信息敏感度相對(duì)較小,這是導(dǎo)致高階紋理特征的穩(wěn)健性相對(duì)高的主要原因。從局部的8個(gè)水平來看,有4個(gè)局部水平的穩(wěn)健性中等及以上的特征占80%,其高階特征的穩(wěn)健性也均優(yōu)于一階特征,這在T1c-HGG水平表現(xiàn)得最為顯著。因此,在影像組學(xué)研究中,對(duì)于一階特征ROI的選取方法要做到高度統(tǒng)一;而對(duì)于表現(xiàn)出高穩(wěn)健的高階特征,在特征篩選過程中可優(yōu)先選擇。②對(duì)從不同ROI選取法和不同序列所提取的特征進(jìn)行單特征分析,以AUC>0.8為標(biāo)準(zhǔn)篩選6個(gè)對(duì)膠質(zhì)瘤分級(jí)性能好的特征,3種ROI選取方法均能提取到分類效能較好的特征,對(duì)腫瘤級(jí)別的鑒定有一定意義,篩出的特征均來源于T1c序列,表明T1c較其他3種序列更有分級(jí)價(jià)值,篩出特征的穩(wěn)健性為一般及較低,提示特征分類效果好壞的特征穩(wěn)健性并無直接關(guān)聯(lián)。③從不同的序列上提取的特征穩(wěn)健性不一致,從T1和FLAIR序列上提取到的特征穩(wěn)健性最好,其次是T1c-LGG和T2序列,T1-HGG的穩(wěn)健性最差,表明從T1和FLAIR上膠質(zhì)瘤的異質(zhì)程度在3種ROI具有相似的一致性,而在T1c序列上高級(jí)別膠質(zhì)瘤中3種區(qū)域的異質(zhì)程度在不同ROI內(nèi)差異較大,低級(jí)別上的差異與T2序列相似,差異高于T1與FLAIR,因此較T1c序列在膠質(zhì)瘤研究中具有極高的診斷價(jià)值。Baeβler等[15]在體模研究中發(fā)現(xiàn):從FLAIR序列中所提取的特征最穩(wěn)健,主要原因是FLAIR模態(tài)抑制了腦脊液等信號(hào),灰度跨度較其他模態(tài)低,導(dǎo)致在預(yù)處理后可在較窄的灰度范圍內(nèi)顯示更多的灰度信息,在高階特征中更為明顯;高階特征類型中NGTDM的穩(wěn)健性最差,與本研究結(jié)論類似。
本文提取出的60個(gè)特征中,有2個(gè)特征在所有序列中均表現(xiàn)出良好的穩(wěn)健性。這2個(gè)特征為GLRLM-RLN和GLSZM-GLN,可在臨床上放心使用。而對(duì)于其他特征,在臨床使用中要特別注意其ROI的范圍及勾畫標(biāo)準(zhǔn)是否高度統(tǒng)一。對(duì)所提取特征進(jìn)行分類評(píng)估后發(fā)現(xiàn):分類性能好的特征并未顯示出高的穩(wěn)健性(分類性能前6個(gè)的特征ICC在0.4~0.7),而穩(wěn)健性好的2個(gè)特征的分類性能較低,這主要是因?yàn)榉€(wěn)健性低的特征不一定代表受試者間的相對(duì)排名有大的改變,因此,特征的穩(wěn)健性與其分類性能并無直接關(guān)系,與Lu等[16]和Hatt等[17]對(duì)PET鼻咽癌和食管癌的研究結(jié)論一致;在影像組學(xué)分析中,對(duì)于ROI的選取標(biāo)準(zhǔn)不一,所得到的大部分紋理特征沒有好的重復(fù)性,因此對(duì)于ROI的選取建議盡量選用相同的標(biāo)準(zhǔn),以得到重復(fù)性高、穩(wěn)健性好的紋理特征,為臨床診斷和預(yù)后提供更可靠的幫助。
本研究的局限性:①納入低級(jí)別膠質(zhì)瘤例數(shù)較少,在下一步研究中將增加低級(jí)別膠質(zhì)瘤病例數(shù);②僅研究了3種ROI選擇方法對(duì)腫瘤紋理特征的一致性,但影響圖像特征穩(wěn)健性和再現(xiàn)性的因素還有很多,如勾畫腫瘤區(qū)域不僅耗時(shí)耗力,且受醫(yī)師個(gè)人經(jīng)驗(yàn)影響,下一步工作將圍繞計(jì)算機(jī)自動(dòng)或半自動(dòng)分割方法與傳統(tǒng)手工勾畫對(duì)所得特征進(jìn)行分析。