胡 奎,張 嫻,白彪勝,王紫君,蔡 茜,劉玉林*
(1.華中科技大學(xué)同濟醫(yī)學(xué)院附屬腫瘤醫(yī)院 湖北省腫瘤醫(yī)院放射科,4.胸部腫瘤內(nèi)科,湖北 武漢 430079;2.蕪湖市繁昌區(qū)人民醫(yī)院影像中心,安徽 蕪湖 241200;3.中南民族大學(xué)生物醫(yī)學(xué)工程學(xué)院,湖北 武漢 430074)
在我國,肺癌占癌癥發(fā)病率和死亡率之首[1]。表皮生長因子受體 (epidermal growth factor receptor, EGFR)-酪氨酸激酶抑制劑(tyrosine kinase inhibitors, TKI)對攜帶EGFR基因突變的非小細(xì)胞肺癌(non-small cell lung cancer, NSCLC)的治療效果優(yōu)于以鉑類藥物為基礎(chǔ)的化學(xué)治療[2]。目前主要依賴于放射學(xué)檢查評估靶向藥物療效。既往研究[3-5]表明,影像組學(xué)對評估免疫治療、放射治療等對于肺癌的療效和預(yù)測淋巴結(jié)轉(zhuǎn)移、預(yù)后等均具有重要應(yīng)用價值。本研究探討基于增強CT構(gòu)建的影像組學(xué)模型預(yù)測靶向藥物治療EGFR基因突變NSCLC患者預(yù)后的可行性。
1.1 一般資料 回顧性分析2014年1月—2016年12月湖北省腫瘤醫(yī)院86例經(jīng)病理證實存在EGFR基因突變NSCLC患者,男34例、女52例,年齡34~76歲、平均(57.7±10.0)歲;臨床分期ⅢB 期3例、Ⅳ期83例;確診后分別接受吉非替尼(n=45)、??颂婺?n=27)及厄洛替尼治療(n=14);其中62例無進展生存期(progression free survival, PFS)>6個月,24例PFS≤6個月。納入標(biāo)準(zhǔn):①經(jīng)病理證實原發(fā)性NSCLC且存在EGFR基因突變;②確診后未經(jīng)其他抗腫瘤治療;③臨床及影像學(xué)資料完整。排除標(biāo)準(zhǔn):①合并其他系統(tǒng)原發(fā)性惡性腫瘤;②病灶最大徑小于10 mm。
1.2 儀器與方法 采用GE Revolution EVO、GE LightSpeed VCT、Siemens SOMATOM Definition As+ CT機。囑患者平臥,雙臂上舉,足先進,于吸氣后憋氣接受掃描,掃描范圍自肺尖至下肋膈角;參數(shù):管電壓100~120 kV,自動毫安管電流,矩陣512×512,重建圖像層厚及層間距均為5 mm。完成平掃后,采用雙筒高壓注射器經(jīng)肘靜脈以流率1.8~2.5 ml/s注射對比劑碘海醇(350 mgI/ml)60~80 ml,延遲35~45 s行增強掃描。
1.3 提取特征 存儲DICOM格式圖像,以雙線性內(nèi)插法進行重采樣處理,重采樣層厚、層間距均為1 mm,以nii格式保存并導(dǎo)入ITK(https://www.itksnap.org,Version 3.8.0)軟件。由醫(yī)師1(具有5年工作經(jīng)驗)手動于肺窗(窗寬2 000 HU,窗位-600 HU)圖像中勾畫病灶ROI,對多發(fā)病灶患者在盡可能規(guī)避含肺不張病灶的前提下選取其中最大病灶,并生成三維ROI;由醫(yī)師2(具有8年工作經(jīng)驗)復(fù)核[6],見圖1。以開源pyradiomics包對每個病灶提取396個特征,包括42個直方圖強度特征、9個形狀特征、10個Haralick特征,以及11個灰度區(qū)域大小矩陣、144個灰度共生矩陣和180個灰度游程長度矩陣。
圖1 于肺窗CT圖像中手動勾畫病灶ROI示意圖 A~C.分別為軸位(A)、冠狀位(B)、矢狀位(C)肺窗CT圖; D.根據(jù) A~C生成的病灶三維ROI
1.4 數(shù)據(jù)預(yù)處理及特征選擇 首先刪除樣本中方差為0的特征,以中位數(shù)填充替代缺失值;而后對396個特征進行Z-score歸一化處理。采用主成分分析(principal components analysis, PCA)進行特征降維,獲得396個新的維度特征,選取其中可解釋方差值居前23位者(圖2),計算累積可解釋方差為94.35%(即23個新特征具備396個初始特征的94.35%信息)。
1.5 建立預(yù)測模型 將患者按7∶3比例隨機分入訓(xùn)練集(n=59, 16例PFS≤6個月、43例PFS>6個月)和測試集(n=27,8例PFS≤6個月、19例PFS>6個月)。由醫(yī)師1對比觀察治療前后肺部增強CT圖像,根據(jù)實體瘤療效評價標(biāo)準(zhǔn)(respond evaluation criteria in solid tumors, RECIST)1.1評估腫瘤是否進展并計算PFS。
以“0”為PFS≤6個月的標(biāo)簽,“1”為PFS>6個月的標(biāo)簽。經(jīng)PCA降維后,訓(xùn)練集和測試集樣本的23個新特征值熱圖見圖3。將訓(xùn)練集23個特征輸入訓(xùn)練模塊,得到邏輯回歸模型。
圖3 PCA降維后訓(xùn)練集和測試集樣本特征值熱圖 A.訓(xùn)練集,共59行23列,對應(yīng)59個樣本的23個維度特征值; B.測試集,共27行23列,對應(yīng)27個樣本的23個維度特征值
1.6 統(tǒng)計學(xué)分析 采用SPSS Version 26.0.0.0統(tǒng)計分析軟件。以±s表示計量資料,行t檢驗;采用χ2檢驗比較計數(shù)資料。分別采用受試者工作特征(receiver operating characteristic, ROC)曲線、校準(zhǔn)曲線、影像組學(xué)評分瀑布圖及決策曲線評價上述模型評估患者預(yù)后的價值。P<0.05為差異有統(tǒng)計學(xué)意義。
訓(xùn)練集與測試集患者性別、年齡、臨床分期、靶向治療藥物及PFS差異均無統(tǒng)計學(xué)意義(P均>0.05),見表1。
表1 訓(xùn)練集與測試集患者資料比較
ROC曲線顯示,以維度特征構(gòu)建的邏輯回歸模型評估訓(xùn)練集、測試集患者預(yù)后(PFS≥6個月)的曲線下面積(area under the curve, AUC)分別為0.923、0.849;訓(xùn)練集和預(yù)測集校準(zhǔn)曲線與理想模型的對角線均較為接近;影像組學(xué)評分瀑布圖顯示測試集的陰性預(yù)測率為100%,陽性預(yù)測率為86.36%;決策曲線顯示訓(xùn)練集和測試集在0.20~0.90閾概率范圍內(nèi)有很好的凈獲益。見表2和圖4。
圖4 邏輯回歸模型評估EGFR基因突變NSCLC患者經(jīng)靶向治療后預(yù)后的曲線 A~D.分別為訓(xùn)練集ROC曲線、校準(zhǔn)曲線、影像組學(xué)評分瀑布圖和決策曲線; E~H.分別為測試集ROC曲線、校準(zhǔn)曲線、影像組學(xué)評分瀑布圖和決策曲線
表2 邏輯回歸模型評估訓(xùn)練集及測試集EGFR基因突變NSCLC患者經(jīng)靶向治療后預(yù)后的效能
EGFR基因是已知NSCLC突變基因中最常見者之一,針對其進行靶向治療已成為治療NSCLC的重要方法[7]。一項薈萃分析[8]結(jié)果表明,存在EGFR基因敏感突變的NSCLC患者接受一線靶向治療后PFS為10.19~15.93個月,6個月無疾病進展率為83%;但靶向治療耐藥率較高,且部分存在EGFR基因突變NSCLC患者對靶向治療不夠敏感。LEONETTI等[9]指出,腫瘤分子高度異質(zhì)性是其對靶向藥物發(fā)生耐藥并導(dǎo)致療效存在個體差異的重要原因。目前評估腫瘤異質(zhì)性及療效主要依靠反復(fù)進行穿刺活檢進行組織病理學(xué)檢查,但其有創(chuàng),可能導(dǎo)致并發(fā)癥,且患者依從性較低。既往研究[10]表明,利用影像組學(xué)分析可評估腫瘤異質(zhì)性,亦可鑒別存在突變型與野生型EGFR基因的NSCLC[11]。
AERTS等[12]納入47例存在EGFR突變的早期 NSCLC患者,根據(jù)單藥吉非替尼靶向治療前后平掃CT圖像中的183個組學(xué)特征的差異值建立模型,其預(yù)測療效的AUC>0.74。YOUSEFI等[13]基于40例接受靶向治療NSCLC患者的肺部CT圖像提取影像組學(xué)特征,并聯(lián)合循環(huán)腫瘤DNA(circulating tumor DNA, ctDNA)結(jié)果及臨床因素構(gòu)建COX回歸模型,其評估總生存期和PFS的AUC分別為0.83和0.77。TANG等[14]針對273例接受靶向治療的EGFR突變晚期NSCLC患者觀察逐步回歸模型聯(lián)合臨床模型預(yù)測靶向治療后PFS的價值,發(fā)現(xiàn)其AUC為0.755。
本研究以接受靶向治療的存在EGFR基因突變的Ⅲ~Ⅳ期NSCLC患者為研究對象,提取其治療前肺部增強CT影像組學(xué)特征,以PCA對特征進行降維,獲得新的維度特征并構(gòu)建邏輯回歸模型,觀察其預(yù)測患者預(yù)后的價值。測試集ROC曲線顯示,邏輯回歸模型評估預(yù)后(PFS≥6個月)的AUC為0.849;校準(zhǔn)曲線與理想模型的對角線均較為接近,提示預(yù)測概率與實際結(jié)果相近;影像組學(xué)評分瀑布圖顯示,測試集中該模型對PFS≤6個月的病例全部預(yù)測正確,陰性預(yù)測率為100%,陽性結(jié)果中3例PFS≤6個月為誤預(yù)測,陽性預(yù)測率為86.40%;決策曲線顯示訓(xùn)練集和測試集在0.20~0.90范圍閾概率內(nèi)有很好的凈獲益,表明該模型應(yīng)用價值較好。本研究所獲邏輯回歸模型評估預(yù)后的效能優(yōu)于YOUSEFI等[13]的COX回歸模型及TANG等[14]的聯(lián)合模型,可能原因在于本研究樣本量相對較大,且資料來源于性能較為接近的3臺64排CT,掃描參數(shù)差異更小。
本研究的局限性:①樣本量有限;②采用交互式方法分割三維圖像,工作量大且穩(wěn)定性欠佳;③基于較平掃CT圖像包含更多病灶信息的增強CT圖像,便于勾畫病灶,但存在強化差異,可能影響最終結(jié)果。
綜上所述,基于CT增強圖像的邏輯回歸模型可用于預(yù)測EGFR基因突變NSCLC患者經(jīng)靶向藥物治療后的預(yù)后。