張成孟,丁治民,陳鵬,劉奇峰
肺癌是全球第二常見的惡性腫瘤,研究表明2020年我國新發(fā)癌癥病例數(shù)排名第一的為肺癌,約82萬人,且肺癌死亡病例數(shù)高達71萬[1]。PIONEER 研究結(jié)果表明,在亞洲人群中,晚期肺腺癌患者的表皮生長因子受體(epidermal growth factor receptor,EGFR) 突變的發(fā)生率高達51.4%,且EGFR突變在女性和非吸煙者中更為常見,即使在經(jīng)常吸煙的人群中這一比例仍有37%[2]。
研究表明,突變的EGFR是表皮生長因子受體酪氨酸酶抑制劑(epidermal growth factor receptor tyrosine kinase inhibitors,EGFR-TKIs)治療非小細胞肺癌(non-small cell lung cancer,NSCLC)的理想靶點[3]。近年來,隨著EGFR-TKIs在臨床的推廣與使用[4],NSCLC患者的預后得到較大的改善[5]。相比于化療,EGFR-TKIs治療的副作用更小,患者的預后更佳。由于EGFR-TKIs的價格比較高,如果用藥后無效,不但加重了患者的經(jīng)濟負擔,還可能會耽誤患者的治療。因此,預測EGFR突變型NSCLC患者EGFR-TKIs的療效對指導臨床制訂準確合理的個體化治療方案具有相當重要意義。
1.研究對象
回顧性搜集2015年4月-2022年6月在本院診斷為 NSCLC且行EGFR基因檢測的患者的CT和臨床資料。納入標準:①原發(fā)病灶經(jīng)活檢病理證實為NSCLC且EGFR基因檢測為突變陽性的患者;②有完整的臨床資料(患者接受靶向治療前的年齡、性別、腫瘤病理分型、癌胚抗原和細胞角蛋白19片段);③可獲得患者靶向治療前的CT圖像;④可獲得患者服用EGFR-TKIs 3個月后的CT圖像。排除標準:①各種原因?qū)е虏≡钸吘夛@示欠清,導致難以準確勾畫病灶的ROI;②肺部原發(fā)腫瘤己切除。
本研究最初將378例行EGFR基因檢測的NSCLC患者納入總樣本,在排除72例EGFR突變陰性、20例臨床資料不全、29例病灶邊緣難以勾畫、63例服用EGFR-TKIs 3個月后CT資料缺失的患者后,最終入組194例。將入組患者按照7∶3的比例隨機分為訓練集和驗證集。
本回顧性研究獲得了本院倫理委員會的批準,且豁免了患者知情同意。
2.臨床資料的選取
本研究納入的臨床指標包括性別、年齡、腫瘤病理分型、靶向治療前、后腫瘤最大徑、癌胚抗原(carci-noembryonic antigen,CEA)以及細胞角蛋白-19片段(cytokeratin-19-fragment,CYFRA21-1)檢測值。治療前、后腫瘤最大徑由2位工作經(jīng)驗分別為5和15年的影像醫(yī)師在不知曉治療結(jié)果的情況下分別在患者的胸部CT圖像上進行測量,取兩者測量結(jié)果的平均值。當CT平掃圖像上腫瘤的邊界不清時可參考胸部CT增強圖像。以實體腫瘤療效評價標準1.1(response evaluation criteria in solid tumours,RECIST 1.1)為依據(jù)對靶向治療的效果進行評估,比較患者靶向治療前及治療3個月后CT圖像上病灶的大小來進行判定,將完全緩解(complete response,CR)和部分緩解(partial response,PR)的患者納入治療有效組,病變穩(wěn)定(stable disease,SD) 和病變進展(pogressive disease,PD)的患者劃為治療無效組(圖1、2)。
圖1 男性,76歲。a)接受靶向治療前的CT平掃肺窗圖像,腫瘤最大徑為38mm;b)接受靶向治療3個月后的CT平掃肺窗圖像,腫瘤最大徑為21mm,與治療前相比腫瘤最大徑減少了約45%,符合PR的標準,故該患者被納入治療有效組。
3.CT檢查方法
所有患者在接受靶向治療前及治療3個月之后均進行了胸部CT檢查。使用Philips Brilliance 64排螺旋CT 機,患者取仰臥位,掃描參數(shù):120 kV,220 mA,層厚5.0 mm,層距5.0 mm,視野為30 cm×30 cm。對比劑使用碘化醇(300 mg I/mL),劑量1.5 mL/kg,注射流率2.5 mL/s,在對比劑注射后25和40~65 s分別行動脈期和靜脈期增強掃描。
4.特征提取及預測模型的建立
將所有患者的胸部CT平掃圖像從PACS系統(tǒng)以DICOM格式導入ITK-SNAP 3.8.0軟件,并將圖像進行匿名化處理。首先由一位影像科醫(yī)師(具有5年工作經(jīng)驗)在胸部CT肺窗圖像(窗寬1500 HU,窗位-500 HU)上沿腫瘤的邊緣逐層勾畫ROI,注意避開液化和壞死區(qū),對于部分邊界欠清的病灶勾畫時參考增強圖像[6]。最后,融合生成病灶的容積感興趣區(qū)(volume of interest,VOI)。然后,將勾畫了ROI的圖像導入基于Python 3.6.8編寫的開源組學分析平臺FeAture Explorer(FAE,v0.5.2,https://github.com/salan668/FAE)進行影像組學特征提取和分析[7]。2周后隨機抽取50例患者的CT圖像,由這位醫(yī)師和另外一位影像科醫(yī)師(具有15年以上工作經(jīng)驗)再次進行ROI的勾畫和特征的提取。對兩位醫(yī)師及同一位醫(yī)師前、后2次提取的特征進行可重復性檢驗,刪除組內(nèi)及組間相關系數(shù)(intra-and inter-class correlation coefficient,ICCs)<0.80的特征,然后將篩選后的影像組學特征進行Z-score標準化處理,以確保數(shù)據(jù)之間的可比性。
在訓練集中使用主成分分析(principal component analysis,PCA)、kruskal-wallis(KW)檢驗和邏輯回歸分析結(jié)合最小絕對值收斂和選擇算子(logistic regression via least absolute shrinkage and selection operator,LR-LASSO)對影像組學數(shù)據(jù)進行降維及模型構(gòu)建,并采用5折法進行交叉驗證,以提高模型的穩(wěn)定性。通過計算每個納入特征的值×其權(quán)重系數(shù)再計算總和得出每例患者的影像組學標簽值(Radiomic score,Radscore)。
將組間比較差異有統(tǒng)計學意義的臨床變量納入多因素logistics回歸分析,計算出治療有效的獨立預測因子并以此構(gòu)建臨床模型;然后,將有統(tǒng)計學意義的臨床變量和影像組學標簽納入多因素logistics回歸分析來構(gòu)建聯(lián)合模型。
5.統(tǒng)計分析
使用SPSS 25.0 軟件和R 4.2.1軟件進行統(tǒng)計分析。采用Kolmogorov-Smirnov檢驗對計量資料進行正態(tài)性檢驗,符合正態(tài)分布的計量資料采用均數(shù)±標準差表示,不符合正態(tài)分布的計量資料采用中位數(shù)(上、下四分位數(shù))表示。計量資料的組間比較采用獨立樣本t檢驗(正態(tài)分布且方差齊)或Mann-WhitneyU檢驗(偏態(tài)分布或方差不齊),計數(shù)資料的組間比較采用χ2檢驗或 Fisher確切概率法。采用多因素logistic 回歸分析構(gòu)建預測模型并繪制諾模圖,采用校正曲線評價模型的擬合優(yōu)度(P>0.05表示擬合優(yōu)度較好),并采用Hosmer-Lemeshow檢驗評價校正曲線的一致性。采用AUC評價各種模型對療效的診斷效能,并采用DeLong檢驗比較不同模型間AUC的差異。采用決策曲線分析(decision curve analysis,DCA)比較模型的臨床凈收益。以P<0.05為差異有統(tǒng)計學意義。
1.臨床資料的比較
194例患者隨機分為訓練集和驗證集,其中訓練集136例,驗證集58例,兩個數(shù)據(jù)集之間以及2個數(shù)據(jù)集中治療有效組與無效組之間各項臨床指標、腫瘤形態(tài)學特征及病理結(jié)果的比較結(jié)果分別見表1和表2。訓練集與驗證集之間性別、年齡、腫瘤病理分型、靶向治療前腫瘤最大徑及CEA和CYFRA21-1水平的差異均無統(tǒng)計學意義(P>0.05)。在訓練集和驗證集中,治療有效組與無效組之間年齡、性別、CEA、肺癌病理類型差異均無統(tǒng)計學意義(P>0.05),治療前腫瘤最大徑和CYFRA21-1水平的差異均有統(tǒng)計學意義(P<0.05)。
表1 訓練集及驗證集中臨床資料的比較
表2 訓練集及驗證集中治療有效組和無效組的臨床資料、腫瘤形態(tài)學特征及病理結(jié)果的比較
2.影像組學特征提取及影像組學模型建立
自每例患者的病灶共提取到1781個影像組學特征,刪除無效特征196個及組內(nèi)和組間ICC<0.80的特征71個,最終剩余1514個特征。在訓練集中通過PCA、KW法和LR-LASSO進行降維,最終篩選出9個影像組學特征,將其納入回歸模型中,獲得每個特征相應的權(quán)重系數(shù)(表3),計算出所有患者的Radscore。
表3 影像組學模型中納入的組學特征及其權(quán)重系數(shù)
3.建立臨床和聯(lián)合模型
將訓練集中組間差異有統(tǒng)計學意義的臨床變量納入多因素logistics回歸分析,結(jié)果顯示CYFRA21-1(OR=1.059,P=0.048)為治療有效的獨立預測因子,以此構(gòu)建臨床模型。
將訓練集中有統(tǒng)計學意義的臨床病理指標(治療前腫瘤最大徑、細胞角蛋白19片段)及影像組學標簽納入多因素logistic 回歸分析,其中細胞角蛋白19片段(OR=1.058,P=0.037)和影像組學標簽(OR=3.590,P<0.001)為獨立預測因子,建立臨床+影像組學聯(lián)合模型。
4.模型的診斷效能分析
采用ROC曲線分析各類影模型在訓練集和驗證集中預測EGFR突變陽性NSCLC患者EGFR-TKIs療效的效能,結(jié)果見表4、圖3。在訓練集和驗證集中,影像組學模型預測治療有效的AUC分別為0.800(95%CI:0.723~0.876)和0.774(95%CI:0.653~0.895);臨床模型的AUC分別為0.686和0.666;聯(lián)合模型的 AUC 分別為 0.836和0.837,優(yōu)于臨床模型和影像組學模型。
表4 臨床、影像組學和聯(lián)合模型的診斷效能
圖3 臨床模型、影像組學模型及聯(lián)合模型預測療效的ROC曲線。a)訓練集;b)驗證集。
經(jīng)DeLong檢驗,訓練集中聯(lián)合模型與臨床模型之間AUC的差異有統(tǒng)計學意義(Z=-3.136,P=0.002),影像組學模型與臨床模型及聯(lián)合模型之間AUC的差異均無統(tǒng)計學意義(Z=-1.928,P=0.054;Z=-1.958,P=0.050);驗證集中,聯(lián)合模型與臨床模型之間AUC的差異有統(tǒng)計學意義(Z=-2.512,P=0.012),影像組學模型與臨床模型及聯(lián)合模型之間AUC的差異均無統(tǒng)計學意義(Z=-1.109,P=0.268;Z=-1.498,P=0.134)。
繪制聯(lián)合模型的諾模圖(圖4)。聯(lián)合模型在訓練集和驗證集的校準曲線與理想曲線接近,表明預測效果較好(圖5)。采用Hosmer-Lemeshow檢驗分析該模型的擬合優(yōu)度,得到一個不顯著的統(tǒng)計學結(jié)果(訓練集:χ2=4.142,P=0.126,驗證集:χ2=1.104,P=0.576),表明模型未明顯偏離完美的擬合。DCA曲線顯示聯(lián)合模型預測EGFR突變陽性NSCLC患者EGFR-TKIs治療療效的臨床凈獲益優(yōu)于臨床模型和影像組學模型(圖6)。
圖5 聯(lián)合模型的諾模圖的校準曲線。Apparent為擬合線,Bias-corrected為偏差校準曲線,Ideal為參考線。a)訓練集;b)驗證集。
影像組學是指將數(shù)字醫(yī)學圖像轉(zhuǎn)換為可挖掘的高維數(shù)據(jù),其在許多疾病的鑒別診斷、預后判斷及療效評價等方面的應用日漸增多[8-11]。影像組學近年來因其在提供客觀和可量化的成像信息方面的優(yōu)勢而越來越受到人們的關注。大量研究證實影像組學在良惡性疾病的鑒別及對癌癥分期、病理特征、基因組突變、預后及療效的預測等方面具有可行性和有效性[12-15]。目前對于NSCLC EGFR的相關研究報道中,大部分都停留在影像組學特征預測EGFR基因的某些突變方面[16,17],對于能否基于CT影像組學特征分析對EGFR突變陽性的NSCLC患者EGFR-TKIs的療效進行預測卻少有研究。
2003年,Kris等[18]的研究結(jié)果表明對存在EGFR突變的肺癌患者使用EGFR-TKIs治療后可以獲得較好的療效,開啟了存在EGFR突變的非小細胞肺癌患者靶向治療的時代。美國國家綜合癌癥網(wǎng)絡(National Comprehensive Cancer Network,NCCN)和我國制訂的肺癌治療規(guī)范中均推薦對肺癌患者應盡可能檢測EGFR基因狀態(tài),對EGFR突變陽性NSCLC患者推薦進行EGFR-TKIs治療。但是,EGFR-TKIs對部分患者治療效果不佳,所以治療前預測EGFR-TKIs的有效性具有較大的價值。本研究基于胸部CT平掃圖像,納入臨床、病理學、影像學及影像組學特征等多參數(shù)構(gòu)建預測模型,對EGFR突變陽性的NSCLC患者接受EGFR-TKIs治療的療效進行預測,結(jié)果顯示影像組學模型優(yōu)于臨床模型,聯(lián)合細胞角蛋白19片段和影像組學構(gòu)建的聯(lián)合模型對療效的預測能力進一步提升,優(yōu)于影像組學模型和臨床模型。
EGFR-TKIs對NSCLC患者的治療效果受多種因素的影響,如臨床特征、組織病理、腫瘤周圍浸潤程度和分子生物學特征等均會影響其療效,具體的機制也較為復雜。本研究中納入分析的血清腫瘤標志物中的CYFRA21-1是診斷 NSCLC 特異性較高的指標[19],該指標在血清內(nèi)的水平與NSCLC患者的預后具有較好的相關性。張明明等[20]的研究結(jié)果表明奧希替尼治療晚期NSCLC患者效果確切,而且可以顯著降低患者血清內(nèi)細胞角蛋白19片段的水平,進一步說明了細胞角蛋白19片段與腫瘤的預后可能有一定的相關性,本研究中聯(lián)合模型中納入的細胞角蛋白19片段為預測EGFR突變陽性的NSCLC患者EGFR-TKIs療效的獨立預測因子,治療前細胞角蛋白19片段的水平對EGFR-TKIs的療效有一定的預測價值。本研究基于聯(lián)合模型構(gòu)建了預測NSCLC患者療效的諾模圖,建立了簡單易行的治療前評估療效的方法,醫(yī)師可以在治療前通過簡單評分進行個體化的評價,輔助臨床醫(yī)師在治療前判斷EGFE突變陽性的非小細胞肺癌患者采用EGFR-TKIs進行治療的可行性。
本研究中采用PCA進行特征降維,PCA常用于高維數(shù)據(jù)的降維,在組學特征的篩選中應用廣泛。Kickingereder等[21]利用PCA降維方法構(gòu)建的影像組學模型較好地預測了膠質(zhì)母細胞瘤(gliblastoma,GBM)患者對貝伐單抗治療的反應,AUC達0.90。穆建華等[22]采用PCA降維方法構(gòu)建了6種影像組學模型對腦膠質(zhì)瘤的病理分級進行預測,AUC均大于0.8,提示模型的診斷效能均較高,驗證了影像組學模型對膠質(zhì)瘤術(shù)前分級具有較高的準確性。
本研究存在一定的局限性:①樣本數(shù)據(jù)是回顧性收集,納入的患者就診時間跨度較大,部分患者的信息不完整,選擇偏倚是不可避免的;②傳統(tǒng)影像學定性評價缺乏統(tǒng)一評價標準,ROI的勾畫可能受到勾畫者主觀因素的影響,而且本研究中曾嘗了ROI半自動及全自動勾畫,但同手動勾畫相比其不能較好的識別腫瘤邊界,根據(jù)實體腫瘤療效評價標準,可能對腫瘤治療的療效判斷產(chǎn)生一些影響;③本研究中僅基于CT平掃圖像進行特征的提取和分析;④樣本數(shù)較小且為單中心研究,需要多中心大樣本進一步研究驗證。
綜上所述,基于臨床、影像組學標簽建立的聯(lián)合模型對預測EGFR突變陽性非小細胞肺癌患者EGFR-TKIs的療效具有較高的價值,優(yōu)于臨床模型及影像組學模型,對臨床合理制定個體化治療方案及科學的評估治療效果具有較高的價值。