徐一銘,袁 梅,邱 琳,于瑞磊,俞同福
南京醫(yī)科大學(xué)第一附屬醫(yī)院放射科,江蘇 南京 210029
肺結(jié)節(jié)及腫塊的鑒別診斷是臨床工作的重點(diǎn)之一,早期診斷及治療對患者意義重大[1]。傳統(tǒng)影像學(xué)主要依賴于CT 圖像上病灶的形態(tài)學(xué)及增強(qiáng)掃描特征進(jìn)行診斷[2]。近年來新興的能譜CT 成像技術(shù)利用各物質(zhì)能譜曲線的差異實(shí)現(xiàn)碘的物質(zhì)分離,同時生成單能量圖像、碘基圖及有效原子序數(shù)圖,提供更多輔助診斷的定量參數(shù)。目前已有學(xué)者初步探討能譜CT 成像技術(shù)在肺部炎性及惡性病變上的鑒別診斷價值,二者在能譜曲線斜率及碘濃度等定量參數(shù)之間存在差異[3]。然而,能譜CT成像的數(shù)據(jù)信息尚未被充分利用,大量基于影像組學(xué)方法的影像組學(xué)特征可以為疾病診療提供更多信息[4]。本研究在能譜CT定量參數(shù)的基礎(chǔ)上,探討基于碘基圖的影像組學(xué)特征對于肺內(nèi)炎性及惡性的定性診斷價值,尋求更優(yōu)的鑒別診斷策略。
回顧性分析2018年8月23日—2019年8月1日于南京醫(yī)科大學(xué)第一附屬醫(yī)院接受能譜CT 胸部增強(qiáng)掃描的檢查結(jié)果,收集表現(xiàn)為結(jié)節(jié)或腫塊影的影像資料。本研究為回顧性研究,經(jīng)醫(yī)院倫理委員會批準(zhǔn),患者均簽署知情同意書。排除標(biāo)準(zhǔn):①在掃描前接受新輔助治療的惡性病變;②非原發(fā)性惡性病變;③影像表現(xiàn)呈磨玻璃密度;④圖像質(zhì)量差、偽影重以致影響后續(xù)圖像分析。最終共納入123 例,男85 例,女38 例,中位年齡64 歲(37~89 歲),其中惡性組85例(腺癌52例,鱗癌21例,小細(xì)胞癌6例,其他6 例),炎性組38 例,均經(jīng)手術(shù)、CT 引導(dǎo)下細(xì)針穿刺活檢、經(jīng)支氣管鏡活檢或后續(xù)隨訪證實(shí)。
1.2.1 掃描方法
掃描設(shè)備采用Discovery CT 750HD(GE Healthcare 公司,美國),患者取仰臥位,足先進(jìn),于深吸氣末屏氣時進(jìn)行掃描,掃描范圍自兩肺尖至肺底部,經(jīng)肘靜脈團(tuán)注非離子型對比劑碘普羅胺(300 mgI/mL)90 mL,注射流率3 mL/s,分別在動脈期(30 s)、靜脈期(60 s)進(jìn)行掃描,層厚及層距為5.0 mm,轉(zhuǎn)速為0.5 s/r,矩陣512x512,其中動脈期采用能譜掃描模式(gemstone spectral imaging,GSI),管電壓為80~140 kVp 瞬時切換,管電流自適應(yīng),靜脈期采用常規(guī)掃描方式,管電壓為120 kVp,管電流為240 mA。掃描完成后重建出碘基圖、70 keV及40 keV的單能量圖像,重建層厚為1.25 mm,并將重建圖像及原始數(shù)據(jù)傳入GE AW4.6 工作站及影像歸檔和通信系統(tǒng)(picture archiving and communication system,PACS)。
1.2.2 能譜CT參數(shù)分析
使用GSI viewer 瀏覽器進(jìn)行分析,采用最大層面全病灶區(qū)域法放置感興趣區(qū)(region of interest,ROI),盡可能包括整個病灶,同時避開空洞、壞死組織、支氣管、大血管及明顯的鈣化,分別測量ROI 于100、70及40 keV單能量圖像下的CT值、碘濃度(iodine concentration,IC)及有效原子序數(shù)值(effective-Z,Zeff),同時測量與ROI 同層面的降主動脈或左鎖骨下動脈的碘濃度(IC0)及有效原子序數(shù)值(Zeff0),保證同一層面各ROI的位置及大小完全一致[5]。重復(fù)測量3 次,結(jié)果取平均值。后續(xù)的計(jì)算包括:①100-70 keV、70-40 keV、100-40 keV段的能譜曲線斜率λ,公式如下:λ100-70keV=|CT值100keV-CT值70keV|/(100-70),λ70-40keV=|CT 值70keV-CT 值40keV|/(70-40),λ100-40keV=|CT 值100keV-CT 值40keV|/(100-40)。②標(biāo)準(zhǔn)化碘濃度(normalized iodine concentration,NIC),公式為NIC=IC/IC0。③標(biāo)準(zhǔn)化有序原子序數(shù)值(normalized effective-Z,NZeff),公式為NZeff=Zeff/Zeff0。在工作站上測量病灶的軸位最大徑(D),精確到小數(shù)點(diǎn)后1位小數(shù),重復(fù)測量3次取平均值。
1.2.3 影像組學(xué)特征提取
以DICOM 格式從PACS 導(dǎo)出碘基圖,在FireVoxel 軟件中打開,采用最大層面全病灶區(qū)域法手動分割ROI,ROI 的確定方法與1.2.2 所述相同。隨后使用內(nèi)部軟件平臺提取影像組學(xué)特征共107個,包括14個形狀特征,18個一階直方圖特征以及75個紋理特征[24 個灰度共生矩陣(gray level co-occurrence matrix,GLCM)特征、16 個灰度游程矩陣(gray level run-length matrix,GLRLM)特征、16個灰度區(qū)域大小矩陣(gray level size zone matrix,GLSZM)特征、5個鄰域灰度差分矩陣(neighborhood gray-tone differencematrix,NGTDM)特征、14 個灰度相關(guān)矩陣(gray level dependence matrix,GLDM)特征]。
1.2.4 數(shù)據(jù)分析
使用基于Python(3.6.8,https://www.python.org/)的開源組學(xué)分析平臺FeAture Explorer(FAE,v0.2.5,https://github.com/salan668/FAE)進(jìn)行特征分析[6]。由于各特征間數(shù)量級差異較大,對數(shù)據(jù)進(jìn)行Z-score標(biāo)準(zhǔn)化處理,計(jì)算公式為Z=(x-x)/std(x),其中x為某特征在所有樣本中的均值,std(X)為相應(yīng)的標(biāo)準(zhǔn)差。以7∶3 拆分訓(xùn)練集和測試集,訓(xùn)練集86 例(良性組/惡性組=27/59),測試集37例(良性組/惡性組=11/26)。由于惡性組病例較多,采用少數(shù)類樣本合成過采樣技術(shù)(synthetic minority over-sampling technique,SMOTE)使數(shù)據(jù)均衡化,采樣倍率為2.19,采樣后的訓(xùn)練集正負(fù)樣本量達(dá)1∶1(良性組/惡性組=59/59)。首先使用皮爾森相關(guān)系數(shù)法(Pearson correlation coefficients,PCC)降維,移除PCC值高于0.86的冗余特征。隨后通過遞歸特征消除(recursive feature elimination,RFE)進(jìn)一步篩選特征,最終使用線性判別式分類器(linear discriminant analysis,LDA)建立預(yù)測模型,并采用5 折交叉驗(yàn)證法驗(yàn)證分類器的性能。
使用SPSS 21.0 軟件進(jìn)行統(tǒng)計(jì)學(xué)分析,計(jì)量資料滿足正態(tài)性檢驗(yàn)則采用t檢驗(yàn)或校正t檢驗(yàn),并以均數(shù)±標(biāo)準(zhǔn)差()進(jìn)行統(tǒng)計(jì)描述,否則采用Mann-WhitneyU檢驗(yàn),并以中位數(shù)及四分位數(shù)[M(P25,P75)]進(jìn)行統(tǒng)計(jì)描述,多因素分析使用二元Logistic 回歸,使用MedCalc15.2.2 軟件繪制受試者特征(receiver operating characteristic,ROC)曲線,評估模型的診斷效能,以曲線下面積(area under curve,AUC)作為評判標(biāo)準(zhǔn)。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
惡性組CT值70keV、Zeff、NZeff及兩組的D不滿足正態(tài)性檢驗(yàn)(P<0.05),故采用Mann-WhitneyU檢驗(yàn)。惡性組與炎性組比較,除CT值70 keV外,CT值40keV、λ100-70keV、λ70-40keV、λ100-40keV、IC、NIC、Zeff、NZeff、D 差異均有統(tǒng)計(jì)學(xué)意義(表1、圖1~2)。
圖1 腺鱗癌能譜CT圖像(惡性組)Figure 1 Spectral CT images of a patient diagnosed pulmonary adenosquamous carcinoma(malignant group)
表1 兩組間能譜CT參數(shù)比較Table 1 Comparison of spectral CT parameters between the two groups
經(jīng)PCC降冗后剩余91個特征,經(jīng)RFE特征選擇后最終共篩選出10 個影像組學(xué)特征用于建立預(yù)測模型,包括1 個一階直方圖特征(firstorder_Maximum)、2 個GLCM 特征(glcm_Autocorrelation、glcm_JointAverage)、5 個GLDM 特征(gldm_SmallDependenceHighGrayLevelEmphasis、gldm_LargeDependenceLowGrayLevelEmphasis、gldm_LowGrayLevel -Emphasis、gldm_HighGrayLevelEmphasis、gldm_DependenceVariance)、1 個GLRLM 特征(glrlm_Run-LengthNonUniformity)、1 個 GLSZM 特 征(glszm_SmallAreaEmphasis),各特征在模型中的系數(shù)詳見表2。其中g(shù)lcm_Autocorrelation、gldm_SmallDependenceHighGr-ayLevelEmphasis、glrlm_RunLength-NonUniformity、firstorder_Maximum 的特征系數(shù)為負(fù)值,其余為正值。對預(yù)測模型進(jìn)行ROC 曲線分析,以評估其診斷效能(表3)。
表2 特征在預(yù)測模型中的系數(shù)Table 2 The coefficients of features in the model
表3 ROC曲線分析預(yù)測模型在訓(xùn)練集、驗(yàn)證集及測試集下的性能Table 3 Performance of the model on training set,validation set and test set in ROC analysis
圖2 肉芽腫性炎能譜CT圖像(炎性組)Figure 2 Spectral CT images of a patient diagnosed pulmonary granulomatous inflammation(inflammatory group)
將具有統(tǒng)計(jì)學(xué)意義的能譜CT 參數(shù)納入二元Logsitic回歸分析,NIC為獨(dú)立影響因素(P<0.001)。分別繪制NIC和影像組學(xué)預(yù)測模型的ROC曲線(圖3)并進(jìn)行比較,預(yù)測模型的診斷效能明顯優(yōu)于NIC(Z=2.121,P=0.034,表4)。
表4 ROC曲線分析NIC和預(yù)測模型鑒別肺內(nèi)炎性及惡性病變的性能Table 4 Performance of NIC and the model in identifying inflammatory and malignant pulmonary lesions in ROC analysis
圖3 預(yù)測模型的ROC曲線分析Figure 3 ROC curve analysis of the model
能譜CT 為采用單球管瞬時切換技術(shù)的雙能量CT成像設(shè)備,可以在一次掃描內(nèi)獲取兩組完全匹配的高低能量圖像,同時生成40~140 keV 連續(xù)的101組單能量圖像。由于不同物質(zhì)存在特定的能譜曲線,根據(jù)基物質(zhì)進(jìn)行物質(zhì)分離,可一定程度上實(shí)現(xiàn)物質(zhì)成分的定量評估[7]。碘-水分離生成的碘基圖可量化碘相關(guān)衰減,通過碘濃度反映病變的血供情況,與真實(shí)的增強(qiáng)程度相當(dāng)[8]。目前已有大量研究使用能譜CT圖像及碘基圖,鑒別良惡性病變、評估腫瘤的生物學(xué)行為與預(yù)后、評估淋巴結(jié)轉(zhuǎn)移情況等[9-11]。
本研究使用能譜CT定量參數(shù)鑒別肺內(nèi)炎性及惡性病變。炎性組的CT值40keV、λ100-70keV、λ70-40keV、λ100-40keV、IC、NIC、Zeff、NZeff 均高于惡性組,與既往研究結(jié)果一致[3,12]。70 keV 的單能量圖像可用于模擬管電壓120 kVp的CT掃描圖像,CT值70 keV沒有統(tǒng)計(jì)學(xué)差異,提示炎性組與惡性組病變難以直接通過常規(guī)增強(qiáng)CT 圖像的CT 值區(qū)分。能譜CT 可以通過ROI 的碘濃度反映血供情況,碘濃度越高,能譜曲線斜率增大、在低能級下的X衰減量增高,從而反映出病變血供之間的差異。病灶動脈期的強(qiáng)化程度主要與血供情況與血流有關(guān)。炎性病變主要由增生的肉芽組織構(gòu)成,毛細(xì)血管網(wǎng)豐富,在炎性因子的刺激下,小動脈和毛細(xì)血管網(wǎng)明顯擴(kuò)張,血管通透性增高,對比劑可快速進(jìn)入病灶內(nèi),而腫瘤不成熟的血管生成以及癌組織對管壁的浸潤會導(dǎo)致血管形態(tài)、功能的異常,因此炎性病變較惡性病變呈現(xiàn)更早而明顯的均勻強(qiáng)化。本研究使用同層面主動脈或左鎖骨下動脈對ROI 碘濃度進(jìn)行標(biāo)準(zhǔn)化,可以最小化患者循環(huán)狀況以及掃描時間產(chǎn)生的干擾,使用NIC 更準(zhǔn)確地反映病變的血供情況[13]。
在此基礎(chǔ)上,本研究基于碘基圖提取影像組學(xué)特征,建立肺內(nèi)炎性及惡性病變的預(yù)測模型。使用1 個一階直方圖特征以及9 個紋理特征,以LDA 分類器建立模型,其診斷效能較NIC明顯提高,ROC曲線存在統(tǒng)計(jì)學(xué)差異。在預(yù)測模型中權(quán)重前3的特征分別為glcm_Autocorrelation 以及glcm_JointAverage、gldm_HighGrayLevelEmphasis,其中g(shù)lcm_Autocorrelation 用于度量紋理的粗細(xì)程度,glcm_JointAverage為聯(lián)合概率的灰度加權(quán)和,gldm_HighGrayLevelEmphasis反映高灰度值的分布情況。碘基圖通過顯示碘對比劑的分布情況,著重反映病變血供的異質(zhì)性。既往已有學(xué)者嘗試使用基于碘基圖的影像組學(xué)特征判斷肺癌預(yù)后及病理分級,不同惡性程度的病變之間碘基圖的組學(xué)特征存在顯著差異[14-15]。本文為首次探討碘基圖影像組學(xué)特征對于肺炎性及惡性病變鑒別價值的研究,預(yù)測模型取得明顯優(yōu)于傳統(tǒng)能譜CT定量參數(shù)的診斷效能。
本研究探討并比較能譜CT 定量參數(shù)以及碘基圖影像組學(xué)特征對于肺內(nèi)炎性及惡性病變的預(yù)測價值,存在幾項(xiàng)局限性:①本研究采用動脈期GSI,未評估靜脈期的能譜CT 定量參數(shù)以及碘基圖組學(xué)特征的預(yù)測價值;②病例數(shù)有限,樣本量不足,后續(xù)有待于大樣本的進(jìn)一步研究;③本研究采用最大層面全病灶區(qū)域法,基于最大層面而非全容積進(jìn)行分析,不能反映病變的全貌,可能會存在一定的偏差,有待今后大樣本、基于全容積的研究進(jìn)一步完善。
南京醫(yī)科大學(xué)學(xué)報(bào)(自然科學(xué)版)2021年7期