劉昊沅, 艾和平, 趙俊蘋, 李紅
肺癌是世界癌癥相關(guān)死亡的主要原因,盡管低劑量CT在體檢中的廣泛開展有助于早期篩查,但仍有部分患者就診時病情已處于進展期[1]。非小細胞肺癌(non-small cell lung cancer,NSCLC)約占所有肺癌病例的80%左右[2]。NSCLC的發(fā)生、發(fā)展、侵襲和轉(zhuǎn)移涉及多種基因,目前最常研究的NSCLC驅(qū)動基因包括表皮生長因子受體(epidermal growth factor receptor,EGFR),克爾斯滕大鼠肉瘤病毒癌基因同源物(kirsten rat sarcoma viraloncogene,KRAS)和間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)。過去數(shù)十年,針對基因激活通路的靶向治療為非小細胞肺癌患者的治療帶來革命性變化,尤其是針對EGFR 突變的小分子酪氨酸激酶抑制劑(TKI) 。與標準一線化療方案相比,EGFR-TKI靶向治療的EGFR突變敏感型患者擁有更長的無進展生存期(progression free survival,PFS)和更高的客觀緩解率(objective remission rate,ORR ),而EGFR野生型肺癌患者若接受EGFR-TKI藥物治療,其PFS將會明顯縮短[3],早期準確診斷患者腫瘤基因突變狀態(tài)將對臨床診療意義重大。常規(guī)分子突變狀態(tài)的檢測依賴于術(shù)后基因測序或擴增阻礙突變系統(tǒng)(ARMS),但腫瘤內(nèi)部存在異質(zhì)性,病理活檢可能會出現(xiàn)操作不佳、活檢標本較小及取樣偽影等情況,最終結(jié)果可能無法完全反映腫瘤的整體情況。CT掃描常作為肺癌患者的常規(guī)影像檢查,具有無創(chuàng)、經(jīng)濟、方便等特點。隨著大數(shù)據(jù)時代的來臨及人工智能的發(fā)展,影像組學(xué)(Radiomics)已成為腫瘤分子影像學(xué)中的研究熱點。通過分析影像學(xué)相關(guān)特征與腫瘤分子表型之間的關(guān)系,揭示腫瘤內(nèi)部異質(zhì)性及生物學(xué)相關(guān)特征,極大的提高了臨床診斷客觀性及診斷效能,對患者個體化治療及管理意義重大。本文就影像組學(xué)在非小細胞肺癌中EGFR突變狀態(tài)的早期診斷、EGFR-TKI療效評價、預(yù)后風(fēng)險分層及轉(zhuǎn)移等方面的研究現(xiàn)狀及前景展開綜述。
影像組學(xué)(Radiomics)[4]指從醫(yī)學(xué)影像中高通量地提取定量成像特征,可深度挖掘圖像所包含的信息,為臨床診療及預(yù)后預(yù)測等提供有效信息。一般包括4個步驟。①高質(zhì)量圖像的獲取及重建:根據(jù)研究目的獲取相關(guān)圖像,通常需要對圖像進行標準化處理,從而減少不同掃描協(xié)議及重建參數(shù)差異帶來的誤差。②圖像分割:即感興趣區(qū)(region of interest,ROI)的分割,ROI分割直接影響到特征提取,精確分割是進行影像組學(xué)研究的前提。一般有手動、半自動和全自動等3種方式,其中以手動分割最為準確,但任務(wù)繁重,需耗費大量時間與人力;半自動及全自動分割方法高效且可重復(fù)性高,故目前多采用自動勾畫后由人工輔助修改邊緣的方式[5,6]。③特征提取及篩選:特征提取是關(guān)鍵步驟,一般包括形態(tài)學(xué)特征、一階灰度直方圖特征、二階與高階紋理特征、小波特征等;大量特征可提高事物描述的準確度,但當樣本量過小而特征維度較大時,會導(dǎo)致模型出現(xiàn)過擬合影響其泛化能力,必須對提取的特征進行篩選及降維處理,找出最佳特征,從而提高模型準確性及魯棒性,常用的選擇方法有Lasso-Cox回歸模型、最大相關(guān)最小冗雜(mRNA)、RELIEF和PCA法等。④模型構(gòu)建及分析:常用模型有邏輯回歸(logistic regression)模型[7]、隨機森林算法(radom forest)[8]、決策樹(decision tree)、支持向量機(SVM)模型[9]和人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)[10]等,選取最適合的數(shù)據(jù)模型,然后對模型進行訓(xùn)練及驗證??刹捎檬茉囌吖ぷ髑€(receiver operating curve,ROC)的曲線下面積(area under the curve,AUC)、靈敏度和特異度等評估模型的診斷效能。目前,影像組學(xué)在肺部疾病的診療中應(yīng)用廣泛,如鑒別磨玻璃結(jié)節(jié)的良惡性[11]、預(yù)測肺腺癌的病理分級[12]及預(yù)后預(yù)測[13]。
EGFR突變在亞洲人群中突變率較高,約為50%,好發(fā)于不吸煙的女性患者中[14]。EGFR突變位點主要位于酪氨酸激酶功能區(qū)的18~21外顯子,其中外顯子19缺失(EGFR 19Del)和外顯子21 L858R點突變(EGFR 21L858R)對EGFR酪氨酸激酶抑制劑(TKIs)的治療表現(xiàn)出更好的客觀反應(yīng)率[15]。部分患者在EGFR-TKI治療過程中會出現(xiàn)繼發(fā)性耐藥而導(dǎo)致病情進展,約60%的繼發(fā)性耐藥與外顯子20的T790M位點突變相關(guān)[16]。
既往研究[17-19]指出EGFR突變與不吸煙、病灶小、空氣支氣管征、胸膜回縮等征象有關(guān),含有GGO成分的腫瘤更易發(fā)生EGFR突變。Shi等[20]發(fā)現(xiàn)19外顯子缺失相關(guān)的影像特征包括女性、腫瘤最大直徑較小、胸膜凹陷、無纖維化,而21外顯子突變與無吸煙史、毛刺、亞實性病灶有關(guān)。Zhou等[21]指出具有明顯增強異質(zhì)性或空洞的腫瘤可能與19外顯子的缺失有關(guān)。這些研究主要依賴于傳統(tǒng)形態(tài)學(xué)征象,主觀性較強,且圖像易受掃描條件和重建算法等因素的影響,導(dǎo)致結(jié)果可重復(fù)性差,各中心無法形成統(tǒng)一共識。
影像組學(xué)能對圖像中像素與空間分布關(guān)系進行定量分析及充分挖掘,補充傳統(tǒng)形態(tài)學(xué)成像特征,可作為早期預(yù)測非小細胞肺癌患者EGFR基因突變有用的影像診斷工具[22]。Wu等[23]基于術(shù)前增強CT圖像,提取了849個組學(xué)特征,LASSO回歸分析后顯示10個影像組學(xué)特征與EGFR突變相關(guān),加入臨床特征后模型取得了較好的檢測效能(AUC=0.97),顯著高于單一影像組學(xué)模型(AUC=0.88)及單一臨床模型(AUC=0.84)。周建忠等[24]利用雙能CT靜脈期的組學(xué)特征建立模型,多因素分析后指出,肺腺癌EGFR基因突變狀態(tài)與DECT定量參數(shù)λHU(能譜曲線斜率)存在顯著的相關(guān)性(P=0.004),理論上不同物質(zhì)有其獨特的λHU ,這在一定程度上反映出腫瘤的異型性。唐興等[25]基于多序列MRI影像組學(xué)來預(yù)測EGFR突變,分別在T2WI、DWI序列及ADC圖中提取出404個特征,經(jīng)過SVM-RFE方法篩選后,保留16個最優(yōu)特征,包括4個GLCM、9個GLRLM,1個NGDTM和2個GLSZM,其預(yù)測EGFR突變型的敏感度53.1%,特異度92.9%,準確度75.7%,AUC 0.826;聯(lián)合性別因素構(gòu)建模型,預(yù)測準確率可提升至78.9%,且DWI序列較ADC更有價值。MRI掃描過去常因易受呼吸偽影影響及價格較高等特點,在肺部疾病診斷中應(yīng)用并不廣泛,但MRI有著較高的軟組織分辨率及多序列成像等獨特優(yōu)勢,未來隨著呼吸門控技術(shù)的進一步發(fā)展,基于MRI的影像組學(xué)在肺部疾病的診斷也將有良好的應(yīng)用前景[26]。
此外,有學(xué)者對EGFR突變型非小細胞肺癌相關(guān)紋理特征展開研究。紋理分析是對圖像灰度空間排布位置及規(guī)律的定量分析,腫瘤內(nèi)部異質(zhì)性會導(dǎo)致灰度排列空間性出現(xiàn)微小差異。Sacconi等[27]指出均值(mean)、SD值、偏度(skewness)等一階統(tǒng)計參數(shù)與EGFR基因突變密切相關(guān),其AUC值分別為0.751、0.749、0.641。呂昌生等[28]在肺腺癌 EGFR 突變狀態(tài)與CT紋理灰度共生矩陣相關(guān)性的研究中指出EGFR野生組的對比度均值明顯高于EGFR突變組,且突變組與野生組在對比度、逆差距、相關(guān)性之間的差異具有統(tǒng)計學(xué)意義(P<0.05),這代表著EGFR突變型肺癌圖像紋理溝紋淺、視覺效果模糊。Li等[29]在研究中對比發(fā)現(xiàn)EGFR 19Del CT 圖像中包含4個紋理相關(guān)特征,而這些特征在EGFR 21L858R中不存在;在用于預(yù)測EGFR 19Del 特征中具有最大AUC的特征是偏度(AUC=0.722),而EGFR 21L858R中具有最大AUC的特征是球形(AUC=0.727),這表明EGFR 19Del腫瘤在內(nèi)部紋理特征上表現(xiàn)出差異,而 EGFR 21L858R 腫瘤則在形狀上表現(xiàn)出不同。這可能為開發(fā)針對突變亞型的靶向NSCLC藥物提供基礎(chǔ),為患者帶來更好的治療效果。
楊春生等[30]及Song等[31]基于影像組學(xué)特征成功篩選出EGFR-TKIs治療優(yōu)勢人群,并能快速區(qū)分進展和緩慢進展的EGFR-TKI治療的患者,列線圖在訓(xùn)練集及兩個獨立驗證集的C指數(shù)分別為0.743(95%CI:0.700~0.786)、0.718(95% CI:0.669~0.767)、0.720(95% CI:0.676~0.764)。AERTS等[32]對比觀察了47例早期EGFR突變型NSCLC患者使用吉非替尼治療前后的CT圖像,發(fā)現(xiàn)治療后影像組學(xué)特征Gabor_Energy-dir135-w3的增加與EGFR-TKI療效較好相關(guān)(AUC=0.74)。這些可能代表著腫瘤對EGFR-TKI敏感性差異可以表現(xiàn)在圖像中,利用影像組學(xué)的相關(guān)特征可以幫助臨床早期篩選出EGFR-TKI治療優(yōu)勢人群。Hyun等[33]研究144名TKI靶向治療后因T790M突變造成耐藥的患者,發(fā)現(xiàn)空氣支氣管征與T790M突變陽性有關(guān)(P=0.06)。目前上市的第三代EGFR-TKI藥物(奧希替尼)對EGFR-TKI獲得性耐藥的患者有較好的療效。因此,影像組學(xué)對于EGFR突變型NSCLC患者耐藥突變位點的深入研究將會為患者提供更加個性化和精確的治療選擇。
非小細胞肺癌的預(yù)后與多種因素相關(guān)如個體差異、病理分型、腫瘤原發(fā)灶-淋巴結(jié)-轉(zhuǎn)移(tumor-node-metastasis,TNM)分期等。計算機通過定量化相關(guān)特征可將預(yù)后因素可視化,從而更好的輔助臨床決策。Wang等[8]以3年生存期作為界限,回顧性分析了173例非小細胞肺癌患者的CT圖像及臨床資料,提取了23個特征建立模型,其模型預(yù)測準確率可達79.6%,其中灰度共生矩陣(GLCM)中的逆差矩及角二階矩與肺癌患者的生存期最相關(guān)。晚期非小細胞肺癌患者常發(fā)生遠處轉(zhuǎn)移,提示預(yù)后不良,患者5年生存率較低。肺門及縱隔淋巴結(jié)轉(zhuǎn)移是肺癌較早的轉(zhuǎn)移途徑,與肺癌TNM分期中的N分期高度相關(guān),TNM分期對治療方式與預(yù)后評價有重要意義[34]。從夢迪等[35]基于增強CT成功預(yù)測了IA期非小細胞肺癌淋巴結(jié)轉(zhuǎn)移,這將會幫助避免病理活檢等有創(chuàng)檢查,為下一步治療提供有利證據(jù)。腦也是肺癌遠處轉(zhuǎn)移的常見靶器官,約10%~36%的肺癌會發(fā)生腦轉(zhuǎn)移,導(dǎo)致進行性神經(jīng)功能缺損,給患者帶來極大的危害。Chen等[36]研究75位EGFR突變型非小細胞肺癌腦轉(zhuǎn)移患者的MRI圖像,發(fā)現(xiàn)瘤周水腫程度特征(edema_intensity_squareroot_intensity_median)與患者的生存時間密切相關(guān),同時,基于T1WI+C及T2FLAIR等序列建立影像組學(xué)模型可預(yù)測腦轉(zhuǎn)移瘤發(fā)生風(fēng)險,其AUC、靈敏度、特異度分別為0.977、0.960、0.940。一般來說能夠穿過血腦屏障的腫瘤細胞更具侵襲性和轉(zhuǎn)移性,而腫瘤內(nèi)部及癌周的差異能在影像學(xué)表現(xiàn)出細微變化并被檢測出來[37],這表明影像組學(xué)可在疾病早期對腦轉(zhuǎn)移發(fā)生進行預(yù)測及風(fēng)險評估,提示臨床制定最合適的診療方案,極大改善患者的預(yù)后。
當前,精準醫(yī)療對臨床診療提出了更高的標準,影像組學(xué)作為新興技術(shù),其多參數(shù)的定量分析在疾病診療中具有巨大的優(yōu)勢,其在肺部疾病診療中已展現(xiàn)出巨大的潛能。將分子生物特性與影像學(xué)特征相結(jié)合也是未來腫瘤診療的發(fā)展趨勢。但影像組學(xué)研究尚處于初始探索階段,仍然存在許多問題需要解決:①大部分為回顧性研究,缺乏前瞻性研究,這可能會導(dǎo)致數(shù)據(jù)過擬合,模型泛化能力不足。②各研究間樣本量相差較大,同類型研究的入選標準未達成一致,且部分研究為單中心小樣本研究,缺乏外部獨立驗證,這就需要多中心合作,建立龐大的數(shù)據(jù)庫,提高模型的準確率。③掃描設(shè)備及掃描參數(shù)難以標準化,ROI的勾畫方式未達成一致,這會在一定程度上影響實驗的客觀性及可重復(fù)性。目前已有團隊提出了生物標志物標準化倡議(image biomarker standardization initiative,IBSI)[38],對圖像質(zhì)量、特征提取及預(yù)處理模式提出統(tǒng)一標準,這將增加實驗的可重復(fù)性,盡可能地減少誤差。
未來,隨著影像組學(xué)的進一步成熟,研究隊列的多樣化,大樣本、多中心數(shù)據(jù)庫的完善、機器學(xué)習(xí)算法的更新,上述問題可以得到有效解決,影像組學(xué)也將在肺癌分子診斷與治療中擁有更廣闊的應(yīng)用前景。