王曉妍,潘麗娜,高蓓莉,徐志紅#,胡家安#
(上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院a.住院醫(yī)師規(guī)范化培訓(xùn)全科基地;b.老年病科;c.呼吸與危重癥學(xué)科,上海 200025)
全球癌癥數(shù)據(jù)分析表明,2012 年肺癌約占所有新發(fā)癌癥的13%,是導(dǎo)致癌癥死亡的主要原因[1]。受當(dāng)前檢查方式、體檢意識(shí)、醫(yī)療資源分配等因素影響,多數(shù)肺癌患者確診時(shí)已為晚期,失去了最佳的治療時(shí)機(jī),5 年生存率僅為19.7%[2]。2015 年,精準(zhǔn)醫(yī)療的概念被首次提出,指應(yīng)用現(xiàn)代生物信息及遺傳技術(shù)結(jié)合患者生活環(huán)境及臨床數(shù)據(jù)等,實(shí)現(xiàn)精準(zhǔn)的疾病診斷,并制定個(gè)性化的預(yù)防和診療方案。隨著影像技術(shù)的創(chuàng)新及人工智能的發(fā)展,影像組學(xué)(radiomics)和影像基因組學(xué)(radiogenomics)應(yīng)運(yùn)而生,以此分析腫瘤影像學(xué)特征與分子表型之間的關(guān)系,增加了臨床診斷客觀性,對(duì)指導(dǎo)個(gè)體化治療和預(yù)后評(píng)價(jià)具有重大意義。影像組學(xué)是通過借助計(jì)算機(jī)軟件高通量地從醫(yī)學(xué)影像(CT、MRI、PET 等)中提取定量特征,然后利用統(tǒng)計(jì)學(xué)和(或)計(jì)算機(jī)學(xué)習(xí)的方法,篩選出最有價(jià)值的影像學(xué)特征,來協(xié)助臨床疾病診治的影像分析方法[3]。影像基因組學(xué)則是將基因組學(xué)與多種成像特征(如大小、體積、紋理特征等)聯(lián)系起來,用于分析腫瘤影像學(xué)特征與分子表型之間關(guān)系的影像分析方法[4]。有多項(xiàng)研究證實(shí)了影像基因組學(xué)在指導(dǎo)腦膠質(zhì)瘤等疾病診療中應(yīng)用的可行性,而本文將就影像組學(xué)與影像基因組學(xué)在肺癌診療中的應(yīng)用作一綜述。
美國國家癌癥研究所將影像組學(xué)方法的基本框架分為,①圖像數(shù)據(jù)獲取和重建;②圖像分割與繪制;③特征提取和量化;④分析建立數(shù)據(jù)庫和數(shù)據(jù)共享[5]。數(shù)據(jù)重建指利用獲取的圖像數(shù)據(jù)創(chuàng)建適當(dāng)?shù)臄?shù)據(jù)集,其數(shù)據(jù)可來源于CT、MRI 等結(jié)構(gòu)性影像技術(shù),亦可來源于PET 等功能影像技術(shù),然后利用醫(yī)學(xué)圖像分割方法將圖像分割成腫瘤、正常組織和其他感興趣區(qū)。目標(biāo)感興趣區(qū)域的圖像分割可通過手動(dòng)、自動(dòng)或半自動(dòng)地完成,每種方法各有優(yōu)缺點(diǎn)。自動(dòng)和半自動(dòng)分割方法有更高的可重復(fù)性,但某些情況下不如手動(dòng)分割那么精確;手動(dòng)分割傾向于讀取者間的可變性,且更耗時(shí)?;谌斯ぶ悄艿陌l(fā)展,目前正在研發(fā)自動(dòng)的、可重復(fù)性的快速、準(zhǔn)確且耗時(shí)少的分割工具,如區(qū)域增長(zhǎng)法、水平設(shè)置法、動(dòng)態(tài)輪廓(蛇形)算法等[6],圖像分割完成后即可提取感興趣區(qū)域的影像特征。所提取的特征主要包括兩類,一類為定性描述的常用術(shù)語,如形狀、大小、密度、邊緣、血管生成等;另一類為定量描述病變異質(zhì)性的不可視特征,如直方圖、紋理、小波(包含低頻與高頻,L 和H)、高斯拉普拉斯算子(Laplacian-of-Gaussian,LoG)、灰度共現(xiàn)矩陣(grey level co-occurrence matrix,GLCM)、鄰域灰度色調(diào)差矩陣、灰度級(jí)區(qū)域矩陣及分形維等,需特定計(jì)算機(jī)輔助技術(shù)進(jìn)行提取。已有研究證明,影像組學(xué)在阿爾茨海默病診斷研究中的應(yīng)用價(jià)值;影像組學(xué)在胰腺腫瘤等病變中的研究聚焦于腫瘤的診斷與鑒別診斷、生物學(xué)行為的評(píng)價(jià)、預(yù)后評(píng)估以及放化療的療效評(píng)估等方面,提高了對(duì)腫瘤病變的診斷效能,更精準(zhǔn)地監(jiān)測(cè)腫瘤的進(jìn)展、預(yù)測(cè)腫瘤的預(yù)后,為個(gè)體化及精準(zhǔn)化治療作出貢獻(xiàn)。
在影像基因組學(xué)中,提取定性和(或)定量成像特征并與其基因組學(xué)相關(guān)聯(lián),然后運(yùn)用機(jī)器深入學(xué)習(xí)算法等技術(shù)分析影像特征。深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network)可以執(zhí)行大量紋理分析和數(shù)據(jù)訓(xùn)練,以創(chuàng)建預(yù)測(cè)算法,分析定量數(shù)據(jù)時(shí)考慮一個(gè)特定的臨床問題,如病變表型與腫瘤組織學(xué)或遺傳變體的相關(guān)性、良惡性組織分類、對(duì)治療反應(yīng)的預(yù)測(cè)及治療反應(yīng)的評(píng)估等,最后需要使用內(nèi)部和(或)外部數(shù)據(jù)集驗(yàn)證模型對(duì)結(jié)果進(jìn)行驗(yàn)證。目前,基于MRI 的影像基因組學(xué)已成為乳腺癌及腦膠質(zhì)瘤精準(zhǔn)分類的一種新興手段。
目前已有多項(xiàng)研究表明,基于定量成像的影像組學(xué)對(duì)于肺部良、惡性結(jié)節(jié)有一定的鑒別能力。Kamiya 等[7]的研究發(fā)現(xiàn),相比于良性結(jié)節(jié),惡性肺結(jié)節(jié)的CT 圖像密度直方圖表現(xiàn)出了更高的峰度和更低的偏度,表明CT 圖像密度直方圖的峰度和偏度可能有助于區(qū)分肺良、惡性結(jié)節(jié)。Choi 等[8]發(fā)現(xiàn),包含2 個(gè)影像組學(xué)特征——邊界框前后維和反差矩標(biāo)準(zhǔn)差的模型SVM-LASS,對(duì)診斷肺結(jié)節(jié)良、惡性的準(zhǔn)確率更高(84.6%),邊界框前后維較大或反差矩標(biāo)準(zhǔn)差較小的肺結(jié)節(jié)更可能是惡性的。Balagurunathan 等[9]也發(fā)現(xiàn),影像組學(xué)可應(yīng)用于肺結(jié)節(jié)良、惡性的判別,且其預(yù)測(cè)惡性腫瘤的能力[其受試者工作特征曲線下面積(area under the curve,AUC)為0.85]優(yōu)于肺癌相關(guān)的臨床風(fēng)險(xiǎn)因素(AUC 為0.82),其中基于紋理的定量特征在預(yù)測(cè)癌癥狀態(tài)方面表現(xiàn)出更大的優(yōu)勢(shì)(AUC 為0.88)。Zhu 等[10]利用多變量分析,從485 個(gè)影像組定量特征中提取出5 個(gè)相關(guān)度極高的最佳影像特征,即X3_fos最大值、X0_GLCM_ 最大概率、X2_GLCM_ 集群趨勢(shì)、X6_GLCM 方差及X1_GLRLM_RLN,其AUC 分別為0.718、0.845、0.872、0.788、0.787,靈敏度分別為0.532、0.660、0.766、0.745、0.574,特異度分別為0.810、0.929、0.905、0.786、0.857,以此建立分類模型分析其與腫瘤組織學(xué)分型的相關(guān)性,并驗(yàn)證該模型可良好的區(qū)分肺腺癌和鱗狀細(xì)胞癌,其AUC 為0.905,靈敏度為0.830,特異度為0.929。也有研究發(fā)現(xiàn),影像組學(xué)可應(yīng)用于肺癌放療、化療及免疫治療反應(yīng)的預(yù)測(cè)與監(jiān)測(cè)[11]。盡管各組之間的研究對(duì)象缺乏一致性,但影像組學(xué)在肺癌診斷中的可應(yīng)用性是有目共睹的,這將支持影像組學(xué)在臨床腫瘤診療中的進(jìn)一步應(yīng)用。
一些分子遺傳學(xué)標(biāo)志物在腫瘤發(fā)生過程中起著重要作用。既往基因組研究顯示,肺癌的驅(qū)動(dòng)基因包括表皮生長(zhǎng)因子受體(epidermal growth factor receptor,EGFR)、kirsten 鼠類肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)、間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)、c-ros原癌基因1、轉(zhuǎn)染重排(rearranged during transfection,RET)基因等,其中EGFR 突變最早被發(fā)現(xiàn),近年來針對(duì)ALK 重排及KRAS 突變的研究逐漸增加。
1.EGFR 突變及其亞型:Gevaert 等[12]發(fā)現(xiàn),腫瘤邊緣明顯不規(guī)則(毛刺、分葉或邊界不清)與EGFR 突變相關(guān),野生型EGFR 腫瘤與肺氣腫及氣道異常有關(guān),利用包含肺氣腫、氣道異常、毛玻璃成分百分比和腫瘤邊緣類型4 個(gè)變量的預(yù)測(cè)模型,預(yù)測(cè)EGFR 突變狀態(tài)的AUC 為0.89。一項(xiàng)薈萃分析則表明,腫瘤大小、空洞、支氣管充氣征、分葉和毛刺征單獨(dú)均未顯示出與EGFR 突變間具有統(tǒng)計(jì)學(xué)相關(guān)性,但亞實(shí)性病灶傾向于存在EGFR 突變[13],這可能為患者正確選擇分子靶向治療提供重要線索。在應(yīng)用多參數(shù)建模和定量成像后,Sacconi等[14]發(fā)現(xiàn),CT 值均數(shù)≤4.77、標(biāo)準(zhǔn)差≥93.18 及偏度≥0.72 與晚期肺腺癌EGFR 突變相關(guān)(P 值分別為0.000 1、0.000 1、0.045 9)。外顯子19 和21 缺失是肺腺癌中EGFR 突變最常見的亞型,以及無進(jìn)展生存期和腫瘤反應(yīng)的最強(qiáng)預(yù)測(cè)生物標(biāo)志物。Zhao 等[15]校正了年齡、性別和吸煙史后發(fā)現(xiàn),支氣管充氣征是EGFR 外顯子19 缺失的獨(dú)立預(yù)測(cè)因子(P=0.007)。Shi等[16]發(fā)現(xiàn),與EGFR 外顯子19 缺失相關(guān)的影像特征包括腫瘤較小[平均直徑為(28.51±14.07)mm](P<0.000 1)、胸膜凹陷征(P=0.003 4)及肺無纖維化(P<0.000 1),而毛刺(P=0.009 5)、亞實(shí)性病灶(P<0.000 1)與外顯子21 突變相關(guān)。
2.ALK 重排、KRAS 突變等:Rizzo 等[17]研究發(fā)現(xiàn),支氣管充氣征、胸膜凹陷與EGFR 突變相關(guān),胸腔積液與ALK 重排相關(guān),圓形病灶及非腫瘤所在肺葉結(jié)節(jié)則與KRAS 突變相關(guān)。Wang 等[18]研究了經(jīng)病理證實(shí)的Ⅰ期肺腺癌患者的CT 特征與KRAS 突變間的關(guān)系,發(fā)現(xiàn)毛刺征與KRAS 突變相關(guān)。在應(yīng)用多參數(shù)建模和定量成像后,Rios Velazquez 等[19]觀察了763 例肺腺癌患者的26 個(gè)影像組學(xué)特征,單因素分析顯示,LHL 方差、HLL GLCM 和熵、LoG3 GLCM 逆方差、LoG3 RLGL短期強(qiáng)度及HHH RLGL 長(zhǎng)期強(qiáng)度等16 個(gè)特征與EGFR 突變相關(guān),提示發(fā)生EGFR 突變的腫瘤更不均質(zhì),且LHL 方差、HLL GLCM 和熵、LoG3 RLGL 短期強(qiáng)度、中位數(shù)、LoG3 GLCM反方差、HHH GLCM 相關(guān)及LLL 總能量等14 個(gè)影像組學(xué)特征可區(qū)分EGFR 突變陽性及KRAS 突變陽性病例(AUC=0.80),如LLL 總能量在EGFR 突 變的腫瘤中不足,而在KRAS 突變的腫瘤中則過高。當(dāng)結(jié)合由年齡、性別、吸煙狀況、種族和臨床分期組成的臨床特征預(yù)測(cè)模型(AUC=0.81)可顯著提高預(yù)測(cè)的準(zhǔn)確率(AUC=0.86,特異度為87%,準(zhǔn)確率達(dá)79%)。Yoon 等[20]使用影像組學(xué)方法對(duì)47 例ALK 重排型及17 例c-ros 原癌基因1 或RET 陽性患者進(jìn)行分析,結(jié)果顯示,ALK 重排型病變具有臨床分期晚、中央型、最大標(biāo)準(zhǔn)攝取值更高且1、2、3 體素距離同質(zhì)及2 體素距離總均值較大的特點(diǎn)(P=0.042、0.017、0.005、0.030、0.023、0.028 和0.049)。Plodkowski 等[21]研究發(fā)現(xiàn),RET 陽性組肺腺癌患者的CT 特征與EGFR 突變組相似,病灶多位于中心,c-ros 原癌基因1 重排組患者的病灶則多見于肺周邊部。
雖然目前結(jié)果統(tǒng)一性相對(duì)較差,但都表明影像基因組學(xué)在肺癌診療中應(yīng)用的可行性,期待未來大樣本的多中心研究明確影像組學(xué)與基因組學(xué)之間聯(lián)系,進(jìn)一步指導(dǎo)個(gè)體化治療。
1.治療療效預(yù)測(cè):EGFR 基因突變的發(fā)現(xiàn)及其酪氨酸激酶抑制劑(tyrosine kinase inhibitor,TKI)的成功應(yīng)用,開啟了晚期非小細(xì)胞肺癌靶向治療的時(shí)代。隨著研究的不斷深入和拓展,多種分子驅(qū)動(dòng)基因陸續(xù)被發(fā)現(xiàn),對(duì)這些特定突變位點(diǎn)的靶向藥物及個(gè)體化治療也逐漸進(jìn)入臨床。有研究通過分析敏感者的病理標(biāo)本發(fā)現(xiàn),EGFR-TKI 治療有效與EGFR 激酶結(jié)構(gòu)域突變有關(guān)。所以不少學(xué)者將目光置于影像組學(xué)及影像基因組學(xué)對(duì)肺癌分子靶向治療療效的預(yù)測(cè)。Aerts 等[22]在2014 年利用描述圖像強(qiáng)度、形狀、紋理及多尺度小波這4 項(xiàng)特征,從119 例肺癌及頭頸癌患者的CT 特征中提取了440 個(gè)定量影像特征,發(fā)現(xiàn)一些定量影像特征與患者的預(yù)后密切相關(guān),進(jìn)一步利用基因富集方法分析發(fā)現(xiàn)預(yù)后相關(guān)定量影像特征能夠捕獲腫瘤內(nèi)異質(zhì)性,可能與潛在基因表達(dá)模式相關(guān),如HLH、RLGL 小波灰階不均與基因表達(dá)中的蛋白質(zhì)復(fù)雜結(jié)合相關(guān),RLGL 灰階不均與DNA 重組相關(guān)。隨后,其團(tuán)隊(duì)在2016 年觀察了47 例早期非小細(xì)胞肺癌患者使用吉非替尼治療前、后的影像組學(xué)特征,發(fā)現(xiàn)治療前的影像組學(xué)特征Laws_Energy-10 及Gabor_Energy-dir135-w3(AUC=0.67 及0.74,P=0.03 及0.0003)能夠預(yù)測(cè)TKI 敏感性EGFR 突變,治療后Gabor_Energy-dir135-w3 的增加與吉非替尼治療效果較佳相關(guān),證明基于影像學(xué)的表型分型可用于TKI 敏感與耐藥患者群體之間的分類和治療反應(yīng)的預(yù)估[23]。Yamamoto 等[24]的一項(xiàng)多中心回顧性研究收集了47 例ALK 重排型病例及125 例ALK 野生型病例,對(duì)其24 項(xiàng)CT 特征及6 項(xiàng)臨床特征進(jìn)行分析,結(jié)果顯示<60 歲及中央型、胸膜尾缺失、大量胸腔積液對(duì)預(yù)測(cè)ALK 重排具有一定價(jià)值,ALK 重排目前為公認(rèn)的小分子ATP 競(jìng)爭(zhēng)性TKI——克唑替尼的治療靶點(diǎn),研究各特征與克唑替尼治療療效的相關(guān)性時(shí)發(fā)現(xiàn),腫瘤增大、邊緣形狀發(fā)生變化及腫瘤周圍出現(xiàn)紊亂的血管征象提示療效不佳,表明可以此模型識(shí)別對(duì)克唑替尼治療效果不佳的患者。
2.生存及復(fù)發(fā)預(yù)測(cè):Lee 等[25]研究EGFR 相關(guān)臨床Ⅰ期非小細(xì)胞肺癌患者18F-FDG-PET/CT 特征時(shí)發(fā)現(xiàn),在最大標(biāo)準(zhǔn)攝取值>5.0,直徑>2.43 cm,磨玻璃模糊度≤50%的腫瘤中,EGFR 過表達(dá)更顯著,同時(shí)利用Cox 比例風(fēng)險(xiǎn)模型進(jìn)行多變量分析顯示,最大標(biāo)準(zhǔn)攝取值>4.0 及腫瘤內(nèi)空洞表現(xiàn)是預(yù)后不良的相關(guān)因素。Mattonen 等[26]研究了45 例早期肺癌患者放療后6 個(gè)月內(nèi)的CT 增強(qiáng)圖像,發(fā)現(xiàn)5 個(gè)影像組學(xué)特征(最小灰度、GLCM 同質(zhì)、GLCM 相關(guān)、GLCM 能量、灰階均勻)對(duì)局部復(fù)發(fā)具有良好的鑒別能力,其組成預(yù)測(cè)模型的AUC 為0.85,假陽性率為24%,假陰性率為23%。表明建立一個(gè)基于影像組學(xué)的臨床決策支持系統(tǒng),可能對(duì)肺癌患者放療后早期復(fù)發(fā)的盡早干預(yù)具有指導(dǎo)意義。Coroller 等[27]從肺腺癌CT 增強(qiáng)圖像中基于小波偏斜度、GLCM 簇狀陰影及LoG 偏斜度3個(gè)特征提取了635 個(gè)影像組學(xué)特征進(jìn)行分析及驗(yàn)證,嚴(yán)格根據(jù)可信區(qū)間>0.6 和偽發(fā)現(xiàn)率<5%的標(biāo)準(zhǔn),發(fā)現(xiàn)35 個(gè)特征與遠(yuǎn)處轉(zhuǎn)移具有相關(guān)性,LHL 小波偏度、LoG_sigma 5_mm_2D偏度、LoG_sigma_2_mm_2D 峰度、LoG_sigma_2_mm_3D 標(biāo)準(zhǔn)差及LoG_sigma_2_mm_3D 熵等12 個(gè)特征與高生存率有相關(guān)性,提示該影像組學(xué)特征模型可能為臨床提供腫瘤是否轉(zhuǎn)移及患者生存期等相關(guān)信息,這與Starkov 等[28]研究結(jié)果一致。Chaddad 等[29]發(fā)現(xiàn)基于3 種不同類型的紋理特征,GLCM、NGTDM 鄰域灰度色調(diào)差矩陣和GLZM 灰度級(jí)區(qū)域矩陣的預(yù)測(cè)模型可用作非小細(xì)胞肺癌患者的生存預(yù)判指標(biāo)。按病理分型及TNM 分期研究發(fā)現(xiàn),在大細(xì)胞癌中有5 個(gè)影像組學(xué)特征(粗糙度、紋理強(qiáng)度、灰階不均、區(qū)域大小不均和表面積)、T2期腫瘤中8 個(gè)特征(相關(guān)度、粗糙度、紋理強(qiáng)度、大區(qū)域/高灰階強(qiáng)度、灰階不均、區(qū)域大小不均、體積和表面積)、N0期患者中6 個(gè)特征(相關(guān)度、相異度、紋理強(qiáng)度、大區(qū)域/高灰階強(qiáng)度、灰階不均和表面積)、Ⅰ期肺癌患者中11 個(gè)特征(相關(guān)度、逆矩、相異度、粗糙度、紋理強(qiáng)度、大區(qū)域/高灰階強(qiáng)度、灰階不均、區(qū)域大小不均、區(qū)域大小百分比、分?jǐn)?shù)衍射和表面積)與生存時(shí)間相關(guān),相關(guān)系數(shù)r 的絕對(duì)值介于0.30~0.49,各組中灰階不均值、區(qū)域大小不均值及大區(qū)域/高灰階強(qiáng)度低于中位數(shù)時(shí)一般提示較高的生存率。
可見,影像組學(xué)與影像基因組學(xué)對(duì)肺癌患者生存及預(yù)后評(píng)估有一定的指導(dǎo)意義,未來可作為肺癌患者一種相對(duì)價(jià)格低廉、無創(chuàng)性的復(fù)查的監(jiān)測(cè)手段。
在當(dāng)前精準(zhǔn)醫(yī)療的時(shí)代,雖然遺傳基因組學(xué)提高了個(gè)體化治療的精準(zhǔn)性,但其成本很高,且臨床推廣有限,影像基因組學(xué)涉及定性和(或)定量成像的表型對(duì)特定遺傳圖譜特性進(jìn)行識(shí)別,具有指導(dǎo)治療決策的選擇,改善治療效果的潛力,并且具有無創(chuàng)性及價(jià)格相對(duì)低廉的優(yōu)點(diǎn),這也使其有機(jī)會(huì)成為多次評(píng)估治療反應(yīng)的手段。影像學(xué)和影像基因組學(xué)可以極大地改變醫(yī)學(xué)實(shí)踐,特別是在腫瘤學(xué)方面。肺癌分子遺傳學(xué)特性與多種影像技術(shù)的結(jié)合將是未來肺癌分子診斷與治療的必然趨勢(shì)。但關(guān)于肺癌影像基因組學(xué)的研究尚處于起步階段,目前尚存在局限性,如樣本量小,圖像分割可重復(fù)性差,影像分析標(biāo)準(zhǔn)難以統(tǒng)一,資源共享受限,以及缺乏大數(shù)據(jù)支持等,限制了其發(fā)展,未來需要開展技術(shù)推廣培訓(xùn)以及多中心臨床研究。相信隨著數(shù)據(jù)庫建設(shè)的日益完善與機(jī)器學(xué)習(xí)新算法的出現(xiàn),腫瘤定量成像在診斷、治療反應(yīng)和預(yù)測(cè)預(yù)后等方面的潛能將被進(jìn)一步發(fā)掘出來。