賀蓓,陳敏
1.北京協(xié)和醫(yī)學院,北京 100730;2.北京醫(yī)院放射科,北京 100730; *通訊作者 陳敏 cjr.chenmin@vip.163.com
美國國家肺癌篩查試驗(The National Lung Screening Trial,NLST)推薦對高危人群行低劑量胸部CT 篩查可降低肺癌20%的病死率[1]。然而,低劑量CT掃描增加了不確定肺結(jié)節(jié)的數(shù)目,為肺結(jié)節(jié)的管理帶來了挑戰(zhàn)。影像組學將醫(yī)學圖像轉(zhuǎn)換為可深度挖掘的高維數(shù)據(jù),并對這些數(shù)據(jù)進行分析以支持臨床決策[2]。本文擬從影像組學研究的一般流程、影響因素及肺癌影像組學研究進展等方面進行論述,以期對影像組學在肺癌診斷中的應用提供參考。
影像組學的一般流程包括圖像獲取及重建、病灶分割、特征提取和選擇以及構(gòu)建模型。在圖像質(zhì)量不影響診斷的前提下,掃描及重建參數(shù)不同在臨床工作中較為常見;但應用于影像組學時,重建參數(shù)不同則結(jié)果差異較大。Li 等[3]采用不同重建層厚構(gòu)建預測早期肺腺癌表皮生長因子受體(epidermal growth factor receptor,EGFR)基因突變的模型,結(jié)果顯示,使用1 mm 層厚獲得的模型效能高于5 mm 層厚所得模型。圖像像素大小、重建算法等也可導致結(jié)果的差異[4]。因此,當使用不同掃描設備或同一設備不同參數(shù)時,應進行圖像校正,從而最大程度地減少由于設備不同所致組學特征差異[5]。
病灶分割是影像組學中的重要部分。肺癌的病灶分割包括手動分割及自動分割。手動分割描繪病灶輪廓的準確性高于半自動分割,但費時費力,且閱片者對病灶的勾勒存在主觀差異(即組間差異)。半自動及全自動具有較高的分割效率以及可重復性和一致性。
圖像特征包括語義學特征及非視覺特征[2]。對于肺癌,語義學特征包括病灶的部位、大小、形態(tài)、邊緣、毛刺、分葉、空洞、磨玻璃成分、胸膜凹陷等;非視覺特征,即基于影像組學的定量特征,通常包括強度特征、結(jié)構(gòu)特征、紋理特征及小波特征[6]。Bashir 等[7]使用隨機森林構(gòu)建了對非小細胞肺癌進行組織學分型的3 種模型,分別基于語義學特征、基于影像組學特征及兩者全部特征之和?;谟跋窠M學特征和總特征的分類模型在訓練組中的曲線下面積(AUC)均接近1,而在驗證組中的AUC 分別為0.52、0.56。基于語義學特征的模型在訓練組和驗證組均有較好的表現(xiàn),AUC 分別為0.78、0.82。該研究表明影像組學特征的可變性較大,限制了其廣泛應用于臨床。如何提高特征的穩(wěn)定性成為影像組學的一項研究熱點。Larue 等[8]提出四維CT 掃描可篩選出魯棒性較好的特征。
在完成所有組學特征自動提取后,應采用相應的統(tǒng)計學模型選出與假定結(jié)果最相關的特征子集,該過程又稱為降維。選擇高度相關的特征子集可提高模型的準確性[9]。常用的方法包括單變量模型和多變量模型。選出最優(yōu)特征子集后,根據(jù)研究目的選擇合適的分類器。常用于預測的分類器包括神經(jīng)網(wǎng)絡、隨機森林、支持向量機和廣義線性模型等。
2.1 肺癌的診斷及分型 低劑量胸部CT(LDCT)檢查可早期發(fā)現(xiàn)肺癌,但增加了不確定肺結(jié)節(jié)的數(shù)目,具有較高的假陽性率,導致過度診斷[10]。Choi 等[11]使用最小絕對收縮與選擇算子-支持向量機(least absolute shrinkage and selection operator-support vector machine,LASSO-SVM)構(gòu)建了一個基于LDCT 肺結(jié)節(jié)的分類預測模型,并將該模型與美國放射學院的肺癌CT 篩查報告和數(shù)據(jù)系統(tǒng)(Lung RADS)進行比較。結(jié)果顯示,LASSO-SVM 模型預測惡性肺結(jié)節(jié)的準確率高于Lung-RADS 12.4%。
伴有分葉、毛刺征的肉芽腫性結(jié)節(jié)難以與肺腺癌鑒別。Yang 等[12]采用3DU-Net 分割病灶,通過邏輯回歸正規(guī)化進行特征選擇,構(gòu)建了6 種鑒別實性肺腺癌和肉芽腫性結(jié)節(jié)的模型。結(jié)果顯示,影像組學特征結(jié)合臨床信息構(gòu)建的模型優(yōu)于單獨的影像組學模型。除實性肺結(jié)節(jié)的鑒別診斷外,臨床上還需謹慎處理磨玻璃密度肺結(jié)節(jié)。表現(xiàn)為磨玻璃密度的肺結(jié)節(jié)可能的病理類型包括不典型腺瘤樣增生、原位腺癌、微小浸潤 性腺癌及浸潤性腺癌。不同病理類型的肺腺癌預后及處理方式不同,僅依靠形態(tài)學特征難以鑒別[13]。Fan 等[14]利用影像組學對表現(xiàn)為磨玻璃密度的肺結(jié)節(jié)進行病理亞型預測,并分為浸潤前病變及浸潤性肺腺癌。研究者從提取的355 項3D 特征中選取2 項相關性最高的組學特征,構(gòu)建的模型在訓練組及3 個驗證組中的準確率分別為 86.3%、90.8%、84.0%、88.1%。Digumarthy 等[15]對108 枚初篩不具有明顯惡性征象的亞實性肺結(jié)節(jié)基線CT 圖像及最近一次的隨訪CT 圖像分別進行影像組學特征提取,結(jié)果表明,與基線CT組學特征相比,良性結(jié)節(jié)隨訪CT 組學特征無顯著變化;而惡性結(jié)節(jié)隨訪CT 組學特征顯著變化,這一研究結(jié)果有助于縮短不確定亞實性肺結(jié)節(jié)的隨訪周期及頻率,從而更早地進行干預。張紅娟等[16]研究發(fā)現(xiàn),CT紋理分析可鑒別Ⅲ、Ⅳ期不可手術切除的小細胞肺癌和非小細胞肺癌,為最優(yōu)化療方案的選擇提供依據(jù)。
2.2 肺癌的預后及療效評價 部分研究利用影像組學預測肺癌患者的預后。Yang 等[17]研究表明,灰度游程矩陣(gray level run length matrix,GLRLM)及小波特征與肺癌的生存期有關。研究者對肺癌治療Ⅲ前CT 平掃圖像進行2D 及3D 特征提取,采用LASSO 降維構(gòu)建組學列線圖,采用COX 回歸模型及Kaplan-Meier 生存分析,結(jié)果顯示與臨床信息列線圖相比,組學特征的生存一致性指數(shù)較高,兩者結(jié)合可顯著提高預測的準確性。Wang 等[18]采用聚類法選取基于增強CT 的影像組學特征,結(jié)合臨床信息及血液學信息,構(gòu)建了COX 回歸模型(Cox proportional hazard,CPH)及隨機生存森林(random survival forest,RSF)模型預測局部晚期肺癌生存期,結(jié)果顯示,COX 模型較RSF 模型具有更高的一致性分數(shù),兩者分別為0.699、0.648;且基于組學特征、臨床特征及血液學特征構(gòu)建的模型,其一致性分數(shù)在訓練組及驗證組中均高于三者的單獨模型。Arshad 等[19]發(fā)現(xiàn)基于PET/CT 的灰度區(qū)域大小矩陣(gray-level size zone matrix,GLSZM)和鄰域灰度差矩陣(neighborhood gray tone difference matrix,NGTDM)與放療后非小細胞癌的總生存期有關;而臨床常用的SUVmax、SUVmean 及SUVpeak 則無法預測生存期。
影像組學也可用來預測肺癌的遠處轉(zhuǎn)移及復發(fā)。Zhong 等[20]構(gòu)建了一個基于治療前CT 平掃的組學特征集,以預測肺腺癌隱匿性淋巴結(jié)轉(zhuǎn)移。結(jié)果表明,影像組學特征模型的預測效能優(yōu)于臨床病理信息模型。Hu 等[21]分別基于臨床特征、影像組學特征集及臨床-組學特征構(gòu)建預測模型,以預測結(jié)直腸癌患者肺結(jié)節(jié)性質(zhì)。結(jié)果顯示,臨床-組學特征模型預測效能最佳,訓練組及驗證組的AUC 分別為0.929 和0.922。與上述研究不同,Dou 等[22]以肺癌瘤周組織為感興趣區(qū),構(gòu)建影像組學模型以預測肺腺癌的遠處轉(zhuǎn)移率。結(jié)果顯示,與肺癌病灶區(qū)域相比,瘤周組織的影像組學特征預測遠處轉(zhuǎn)移的一致性指數(shù)更高,分別為0.64 和0.59。
立體定向放療(stereotactic ablative radiotherapy,SABR)適用于無法進行手術的肺癌患者,但放療后的肺損傷需要與肺癌的局部復發(fā)相鑒別。Mattonen 等[23]構(gòu)建的影像組學模型能夠發(fā)現(xiàn)更早期的局部復發(fā),尤其對于<6 個月的放療后復發(fā),放射科醫(yī)師幾乎無法發(fā)現(xiàn),而影像組學模型能夠發(fā)現(xiàn)76%的復發(fā)灶。Hao 等[24]發(fā)現(xiàn),基于PET 圖像的影像組學特征中,與強度特征、幾何特征、灰度共生矩陣等相比,殼特征對于放療后遠處轉(zhuǎn)移預測的準確性更高。影像組學用于評估非小細胞肺癌化療效果方面也取得了一定的進展。Coroller 等[25]研究表明,基于治療前CT 影像組學特征構(gòu)建的模型能夠預測病理大體殘留及病理完全緩解,而傳統(tǒng)的腫瘤體積及直徑則無法預測。
2.3 肺癌的影像基因組學研究 肺癌行靶向治療前必須進行基因檢測。檢測樣本通常來自于手術切除或者穿刺標本。目前有研究將影像組學作為一種無創(chuàng)方法預測基因突變,即“影像基因組學”。對酪氨酸激酶抑制劑敏感的EGFR 突變是肺癌靶向治療的重要靶點。Jia 等[26]選擇94 組治療前CT 圖像的組學特征作為訓練集,結(jié)合性別、吸煙史等臨床資料,使用支持向量機分類器構(gòu)建的模型對于預測EGFR 的AUC 達0.828。Li 等[27]采用Logistic 回歸模型五倍交叉驗證法預測19Del 和L858R 突變。結(jié)果顯示,伽柏幅值紋理表征方差、伽柏相位紋理表征熵及球面特征可預測EGFR19Del和L858R突變;且在測試組中兩者的AUC分別為0.7925 和0.7750。Yoon 等[28]構(gòu)建了臨床-影像組學模型以預測ALK、ROS1/RET 融合基因,敏感度及特異度分別為0.73 和0.70。Gu 等[29]研究表明,基于增強CT 的影像組學特征可以預測Ki-67 的表達水平。
影像組學在肺癌的早期篩查、診斷、分型、預后、療效評估、基因預測等方面均有應用。但這些應用多數(shù)尚無法直接投入臨床,其原因是缺乏易于操作、高性能的系統(tǒng)性分析工具;易受圖像采集參數(shù)以及目標選擇、目標分割、特征提取/選擇及建模方法的影響,可變性較大。因此,未來影像組學的發(fā)展方向應當是解決其目前的不足之處,如標準化掃描,使用一致的影像組學方法,提高可重復性,簡化病灶的標注或分割,甚至進行動物實驗等。Choe 等[30]利用卷積神經(jīng)網(wǎng)絡核轉(zhuǎn)換,顯著提高了不同重建算法的CT 圖像影像組學特征的一致性。Wang 等[31]使用深度學習構(gòu)建的預測EGFR基因突變模型表現(xiàn)優(yōu)于手動的影像組學模型。未來深度學習將會成為影像組學取得進一步發(fā)展的重要方法。