徐向東,羅詩維,韋瑞麗,張婉麗,姚旺,丁文雙,龐欣蕊,王曄,楊蕊夢,賴勝圣
腎細胞癌(renal cell carcinoma,RCC)是最常見的腎臟原發(fā)惡性腫瘤,約占腎臟腫瘤的90%~95%[1]。其中,透明細胞腎細胞癌(clear cell renal cell carcinoma,ccRCC)是RCC中最常見的亞型,預(yù)后最差[2]。既往研究證實:病理核分級是判斷ccRCC預(yù)后的獨立影響因素,對其個體化治療措施的制訂尤為重要[3]?,F(xiàn)階段,F(xiàn)uhrman核分級系統(tǒng)是最常用的ccRCC病理核分級體系[4],但其診斷依賴于經(jīng)皮穿刺活檢或術(shù)后組織樣本,存在有創(chuàng)性、滯后性或易出現(xiàn)并發(fā)癥及取樣偏倚等缺點[5]。
近年來,基于無創(chuàng)性醫(yī)學(xué)影像檢查的影像組學(xué)在臨床腫瘤領(lǐng)域的應(yīng)用受到越來越多的關(guān)注,它可以通過高通量提取醫(yī)學(xué)圖像的信息定量評估腫瘤分期、病理分型和治療預(yù)后,進而指導(dǎo)臨床決策的制定[6]。既往研究報道采用影像組學(xué)方法對ccRCC進行病理高低核級別預(yù)測,并取得了良好的預(yù)測效果,然而,腎臟的CT四期動態(tài)掃描各具特點,對納入影像組學(xué)分析的最優(yōu)CT期相選擇尚不統(tǒng)一[7-10]。此外,作為影像組學(xué)分析流程中的重要一環(huán),感興趣區(qū)(region of interest,ROI)的勾畫策略仍存在爭議[11,12]。有研究者建議選用腫瘤最大層面2D-ROI,認為2D-ROI已能提供足夠的影像信息,且勾畫較為簡便;而有研究者認為三維全瘤感興趣區(qū)(3D-ROI)能提供更全面的信息,如3D形態(tài)學(xué)特征等。因此,本研究旨在探討不同CT掃描期相及不同ROI勾畫策略(2D-ROI或3D-ROI)對影像組學(xué)方法預(yù)測ccRCC核分級效能的影響。
回顧性搜集2011年1月-2019年1月在本院就診且符合研究要求的137例ccRCC患者的臨床和影像資料。納入標(biāo)準(zhǔn):①病理證實為ccRCC且有完整的Fuhrman核分級信息;②術(shù)前行腹部CT平掃及三期增強掃描。排除標(biāo)準(zhǔn):①囊性ccRCC;②CT圖像上有明顯偽影,圖像質(zhì)量欠佳。
病理切片F(xiàn)uhrman核分級由具有9年泌尿系統(tǒng)病理診斷經(jīng)驗的病理醫(yī)師完成。為確保病理診斷的可重復(fù)性和減少觀察者間差異性,傳統(tǒng)的4級Fuhrman核分級系統(tǒng)被簡化為低級別(1級和2級)和高級別(3級和4級)。
使用Toshiba Aquilion One(14例)、Siemens Somatom Definition(36例)、GE HiSpeed 16(14例)和Philips Brilliance 64(73例)螺旋CT機。掃描參數(shù):120~140 kV,自動管電流調(diào)控。增強掃描采用高壓注射器經(jīng)肘靜脈注入非離子型碘對比劑(劑量1.0~2.0 mg/kg)。依次采集4個期相的CT圖像:平掃期(unenhanced phase,UP);增強掃描腎皮髓質(zhì)期(corticomedullary phase,CMP),注射對比劑后約30 s啟動掃描;增強掃描腎實質(zhì)期(nephrographic phase,NP),注射對比劑后約70 s啟動掃描;增強掃描腎排泄期(excretory phase,EP),注射對比劑后180~300 s啟動掃描。
由兩位分別有4年及5年影像診斷經(jīng)驗的放射科醫(yī)師在不知病理結(jié)果的情況下使用ITK-SNAP軟件完成腎臟腫瘤2D-ROI及3D-ROI的勾畫。選取病灶最大層面沿病灶邊緣進行2D-ROI的勾畫;按照上述方法逐層勾畫病灶的ROI,軟件即可自動生成病灶的3D-ROI。先在腎實質(zhì)期圖像上進行勾畫,再將所獲得的各層2D-ROI復(fù)制到其它3個期相的圖像上,依據(jù)情況進行略微調(diào)整(圖1)。采用集合相似度度量函數(shù)Dice系數(shù)來評估兩位醫(yī)師所勾畫ROI的相似度。對于Dice系數(shù)>0.9的病例,取兩位醫(yī)師勾畫區(qū)域的交集;對于Dice系數(shù)<0.9的病例,兩位醫(yī)師通過進一步分析和討論來解決沿病變邊界勾畫ROI時的差異問題,以達成一致。
首先,使用Pyradiomics軟件,在每個期相的圖像上分別基于2D-ROI和3D-ROI提取病灶的形態(tài)學(xué)特征、直方圖特征及紋理特征。然后采用22種特征選擇方法[conditional infomax feature extraction (CIFE),conditional mutual information (CMIM),double input symmetrical relevance (DISR),interaction capping (ICAP),joint mutual information (JMI),mu-tual information based feature selection (MIFS),mutual information maximisation (MIM),minimal redundancy maximum relevance (MRMR),fisher_score,lap_score,relevant features (reliefF),spectral feature selection (SPEC),trace_ratio,ll_121,ls_121,multi-cluster feature selection (MCFS),nonnegative discriminatve feature selection (NDFS),robust feature selection (RFS),unsupervised discriminative feature selection (UDFS),f_score,gini-index,t_score]分別與8種分類算法[邏輯回歸(logistic regression,LR),支持向量機(support vector machine,SVM),樸素貝葉斯(na?ve bayers),K-近鄰算法(K-nearest neighbor,KNN),決策樹(decision tree,DT),Bagging引導(dǎo)聚類算法,隨機森林(random forest,RF),自適應(yīng)增強算法(adaptive boosting,AdaBoos-ting)]進行組合用于構(gòu)建影像組學(xué)模型,共建立了176(22×8)個預(yù)測模型,并采用五折交叉檢驗法驗證模型的效能。為了減少病例隊列數(shù)據(jù)數(shù)量不均衡產(chǎn)生的影響,通過引入合成特征樣本,采用合成少數(shù)類過采樣技術(shù)(synthetic minority oversampling technique,SMOTE)對高級別ccRCC組進行過采樣。模型的鑒別效能采用ROC曲線下面積(area under the curve, AUC)、符合率、敏感度和特異度等指標(biāo)進行定量分析。
使用SPSS 20.0軟件進行統(tǒng)計學(xué)分析。比較ccRCC核分級高級別組和低級別組之間臨床特征及影像學(xué)特征的差異。計量資料的組間比較采用獨立樣本t檢驗,二分類變量的組間比較采用卡方檢驗。以P<0.05為差異有統(tǒng)計學(xué)意義。
137例中低級別ccRCC組96例(1級15例,占10.9%;2級81例,占59.1%)及高級別ccRCC組41例(其中3級32例,占23.4%;4級9例,占6.6%)。兩組患者的臨床和病灶特征的比較見表1。兩組之間年齡、性別構(gòu)成和病灶直徑的差異均無統(tǒng)計學(xué)意義(P>0.05)。
表1 高、低核分級ccRCC患者臨床和影像學(xué)特征的比較
每個期相的圖像上,基于2D-ROI或3D-ROI各提取了107個組學(xué)特征,基于不同的算法組合,各建立了176個預(yù)測模型。采用ROC曲線分析模型預(yù)測高級別ccRCC的效能,每個期相中基于2D-ROI和3D-ROI構(gòu)建的模型中AUC最大的5個模型的效能指標(biāo)的平均值見表2。結(jié)果顯示,每個期相基于3D-ROI構(gòu)建模型的AUC平均值要大于2D-ROI,相應(yīng)的符合率、敏感度和特異度大部分也有類似表現(xiàn),即基于3D-ROI的影像組學(xué)模型顯示出更好的預(yù)測能力。此外,在四個期相中,平掃期的平均AUC明顯高于其它3個期相,提示基于平掃圖像的組學(xué)特征模型具有更好的診斷效能?;?D-ROI和3D-ROI的平掃期各組學(xué)模型的AUC熱圖見圖2。總體而言,基于3D-ROI的模型與基于2D-ROI的模型相比預(yù)測效果更好。其中KNN分類算法在兩組中均顯示出較好的效能,而DT算法在兩組均表現(xiàn)不佳。
圖2 平掃期CT圖像上基于2D-ROI(2a)和3D-ROI(2b)提取的影像組學(xué)特征構(gòu)建的176個預(yù)測模型的AUC熱圖。
表2 四期CT圖像基于2組構(gòu)建的組學(xué)模型的效能指標(biāo)值
核分級作為ccRCC的獨立預(yù)后因素,可為治療策略的制訂提供重要參考[13]。若能在術(shù)前了解ccRCC的核分級信息,將對臨床診療的實施提供關(guān)鍵性幫助[2]。穿刺活檢是術(shù)前評估腎腫瘤的常用手段,但其為有創(chuàng)性檢查存在發(fā)生并發(fā)癥的可能,而且其診斷效能依賴于取樣技術(shù)和經(jīng)驗等[14]。影像學(xué)檢查作為臨床上廣泛應(yīng)用的無創(chuàng)性評估腎腫瘤的方法,為臨床診療提供了很多指導(dǎo)和幫助,而近年來出現(xiàn)的影像組學(xué)方法可進一步挖掘醫(yī)學(xué)影像的潛在價值,有望為臨床診療提供更多信息。
目前基于CT的影像組學(xué)方法已經(jīng)廣泛應(yīng)用于腹部疾病的研究[15],在腎臟腫瘤方面的研究主要集中在腎臟良惡性腫瘤的鑒別和腎細胞癌的核分級[16-18]。ROI的勾畫作為影像組學(xué)分析基本流程中至關(guān)重要的一環(huán),影響到所提取的影像組學(xué)特征的可重復(fù)性和穩(wěn)定性,進一步?jīng)Q定了后續(xù)機器學(xué)習(xí)模型的效能[19]。其中,選擇腫瘤最大層面的2D-ROI還是腫瘤多個層面的3D-ROI一直存在爭議。2D-ROI更容易獲得,耗費的人力更少,復(fù)雜度更低,后續(xù)的計算速度更快。而3D-ROI包含了腫瘤的每一個層面,可提供更多關(guān)于腫瘤的信息,如三維形態(tài)學(xué)信息,但其勾畫比較耗費人力和時間。Yang等[20]對比了基于2D-ROI和3D-ROI的CT紋理分析在預(yù)測肺腺癌淋巴管和血管侵犯方面的效能,結(jié)果顯示基于2D-ROI的預(yù)測效能優(yōu)于3D-ROI。Shen等[12]對比分析了二維和三維CT影像組學(xué)特征在預(yù)測非小細胞肺癌(NSCLC)預(yù)后方面的效能,發(fā)現(xiàn)兩者預(yù)測能力相似,但考慮到二維ROI更容易獲取,因此更推薦采用二維特征進行預(yù)測。Xu等[11]探索了應(yīng)用二維和三維影像組學(xué)特征在多種腫瘤(肝內(nèi)膽管細胞癌、高級別骨肉瘤、胰腺神經(jīng)內(nèi)分泌腫瘤)早期復(fù)發(fā)、淋巴結(jié)轉(zhuǎn)移、5年生存率及病理分級預(yù)測中的效能,結(jié)果顯示兩種方法提取的組學(xué)特征都有一定的預(yù)測效能,但三維影像學(xué)特征的表現(xiàn)優(yōu)于二維,因此更推薦在影像組學(xué)研究中采用三維影像特征。在本研究中,我們對比了2D-ROI和3D-ROI對CT影像組學(xué)模型預(yù)測ccRCC核分級的影響,結(jié)果顯示基于3D-ROI的組學(xué)模型的綜合診斷效能更優(yōu),為后續(xù)腎癌影像組學(xué)研究提供了參考。
在腎癌影像組學(xué)研究中,在掃描期相的選擇方面也一直存在爭議。有研究者僅選取單個期相進行影像組學(xué)研究。如Bektas等[7]自門靜脈期CT圖像上提取二維紋理特征,建立多個機器學(xué)習(xí)分類器來預(yù)測ccRCC核分級,結(jié)果顯示基于SVM的模型表現(xiàn)最佳,AUC達0.860。Kocak等[9]的研究中僅在平掃CT圖像上提取病灶的紋理特征,并分別采用人工神經(jīng)網(wǎng)絡(luò)和二進制邏輯回歸分析建立模型來預(yù)測ccRCC的核分級,相應(yīng)的AUC分別達0.714和0.656。更進一步的研究中,有學(xué)者選用多個增強掃描期相的圖像提取影像組學(xué)特征,探討哪一期相或哪幾個期相聯(lián)合構(gòu)建的模型能取得更好的效果。Haji-Momenian等[21]選取小ccRCC(<4 cm)的平掃期、皮髓質(zhì)期和實質(zhì)期CT圖像進行影像組學(xué)分析,并采用4種算法(KNN、SVM、隨機森林和決策樹)構(gòu)建組學(xué)模型來預(yù)測ccRCC核分級,結(jié)果顯示這4種算法利用皮髓質(zhì)期的直方圖特征構(gòu)建的模型的預(yù)測效果最佳,AUC達0.97。Shu等[22]選用皮髓質(zhì)期和實質(zhì)期增強CT圖像進行影像組學(xué)分析來預(yù)測ccRCC的核分級,結(jié)果顯示基于皮髓質(zhì)期、實質(zhì)期和兩者聯(lián)合的組學(xué)模型的AUC分別為0.766、0.818和0.822。在本研究中,我們發(fā)現(xiàn)不論是選用2D-ROI還是3D-ROI,平掃期對ccRCC核分級的鑒別效果均優(yōu)于其它期相。對此可能的解釋是ccRCC病理核分級由腎癌細胞核大小、不規(guī)則性及核仁顯著性決定,相較于反映腎癌血流動力學(xué)情況的動態(tài)增強期相而言,保留腫瘤細胞核的形態(tài)學(xué)特征的平掃期對核級的鑒別效果更好。
本研究存在一定的局限性:①納入研究的樣本量較小,且缺乏外部驗證集,這是由于病例納入標(biāo)準(zhǔn)較為嚴格,需要具備4期CT圖像,后續(xù)需進一步擴充樣本量;②本研究采用的是Fuhrman核分級系統(tǒng),沒有選擇新的WHO/ISUP核分級系統(tǒng),這是由于我們自2011年開始搜集數(shù)據(jù),當(dāng)時主要采用的是Fuhrman核分級,WHO/ISUP對病理醫(yī)師評判時病理切片的放大倍數(shù)有嚴格要求,有些病例的病理組織切片已缺失;③目前僅對單個掃描期相進行研究,未對多種期相組合的情況進行探索,后續(xù)有待完善;④本研究中病例檢查采用了多臺CT掃描設(shè)備,可能對影像組學(xué)特征的穩(wěn)定性造成影響,但這在一定程度上也可以彌補缺乏外部驗證集的不足。
綜上所述,本研究結(jié)果初步表明基于3D-ROI建立的影像組學(xué)模型在預(yù)測ccRCC核分級方面的表現(xiàn)優(yōu)于2D-ROI建立的模型,基于平掃期的組學(xué)模型比其它期相的表現(xiàn)更佳。這為ccRCC影像組學(xué)的應(yīng)用提供了參考,也需要進一步探索改進分割的方法,更好地推進影像組學(xué)在醫(yī)學(xué)領(lǐng)域的應(yīng)用。