楊彥松,馮峰,傅愛燕,段書峰,陳瑜鳳,葛亞瓊
直腸癌是男性和女性均較常見的惡性腫瘤[1],年齡小于50歲的人群患病率逐年增加,且在低年齡組中死亡率每年增加1%[2]。全直腸系膜切除術(shù)(total mesorectal excision,TME)是用于直腸癌治療的標(biāo)準(zhǔn)經(jīng)腹手術(shù)[3]。腫瘤神經(jīng)周圍侵犯(perineural invasion,PNI)是直腸癌患者轉(zhuǎn)移擴(kuò)散的可能途徑[4],與預(yù)后不良有關(guān)[4-9]。因此術(shù)前準(zhǔn)確預(yù)測(cè)評(píng)估PNI至關(guān)重要[3]。目前評(píng)估直腸癌PNI的影像學(xué)研究較少,本研究旨在探討術(shù)前MR放射組學(xué)模型預(yù)測(cè)直腸癌患者PNI的價(jià)值。
1.一般資料
回顧性分析本院2016年12月-2019年7月經(jīng)TME手術(shù)病理證實(shí)為直腸癌的患者136例。入組標(biāo)準(zhǔn):①手術(shù)病理證實(shí)為直腸腺癌;②MR檢查前未行放化療、新輔助治療等相關(guān)治療;③術(shù)前1周內(nèi)在本院行高分辨率直腸MR掃描。排除標(biāo)準(zhǔn):①術(shù)后病理為粘液腺癌、腫瘤病灶含粘液分泌或其他病理類型的腺癌;②術(shù)前檢查提示遠(yuǎn)處轉(zhuǎn)移或患者身體不佳未行TME手術(shù);③MR檢查圖像偽影較大,無(wú)法勾畫病灶。136例直腸癌患者中,排除16例粘液腺癌,4例含分泌粘液的腺癌,3例神經(jīng)內(nèi)分泌腫瘤,3例腺瘤,最終共計(jì)110例患者入組,其中男76例,女34例,平均年齡(64.2±9.7)歲。
2.MR檢查及方法
患者檢查前禁食4h,檢查前使用開塞露清潔腸道,采用Siemens Magnetom verio 3.0超導(dǎo)MR掃描儀及8通道體部表面相控陣線圈?;颊呷⊙雠P位,足先進(jìn)。掃描范圍設(shè)置為兩側(cè)髂棘到兩側(cè)腹股溝下緣。掃描方案參照文獻(xiàn)報(bào)道方法[10],依次行脂肪抑制T2WI矢狀面及冠狀面、DWI掃描,然后在垂直于直腸腫瘤長(zhǎng)軸方向行高分辨率軸位T2WI 掃描,最后行VIBE系列T1WI平掃和動(dòng)靜脈期增強(qiáng)掃描,掃描參數(shù)見表1。
表1 直腸癌MR掃描參數(shù)
3.圖像勾畫
選取高分辨率T2WI橫軸面病灶最大截面所在層面[11],使用ITK-SNAP3.8軟件勾畫病灶。
4.建立影像組學(xué)特征模型[12-14]
使用AK軟件(GE healthcare,version 3.2.0)從圖像中提取396特征,包括42個(gè)直方圖特征,20個(gè)形態(tài)特征,334個(gè)紋理特征,將患者按13:7的比例分為訓(xùn)練集(72例)和驗(yàn)證集(38例)。訓(xùn)練集用于影像特征的篩選與建模,驗(yàn)證集用來評(píng)估模型的穩(wěn)定性及可行性。首先采用最大相關(guān)最小冗余的方式對(duì)組學(xué)特征進(jìn)行初步篩選,保留10個(gè)有最大預(yù)測(cè)效能的特征,然后將剩余的影像特征作LASSO回歸分析,通過10折交叉驗(yàn)證篩選LASSO回歸模型的最優(yōu)超參數(shù)lambda值,在最優(yōu)lambda值下,特征系數(shù)不為0的參數(shù)作為最終構(gòu)建影像組學(xué)評(píng)分(Radscore)的特征。Radscore為最終所保留的特征與各自對(duì)應(yīng)系數(shù)乘積的和,其公式為Radscore=截距+βi·Xi,按這個(gè)公式分別計(jì)算每一個(gè)樣本的Radscore;并由樣本的Radscore根據(jù)閾值對(duì)樣本進(jìn)行分類,評(píng)分大于閾值的樣本歸為一類,小于閾值的樣本歸為另一類,采用wilcoxon檢驗(yàn)比較兩組間Radscore的差異。ROC曲線分析用于評(píng)價(jià)模型的預(yù)測(cè)能力。首先得到訓(xùn)練集的ROC曲線,根據(jù)約登指數(shù)選擇最優(yōu)的判別閾值,進(jìn)而得到模型在訓(xùn)練集上的效能。決策曲線分析用于分析模型的臨床應(yīng)用價(jià)值。在驗(yàn)證集中,根據(jù)影像組學(xué)評(píng)分公式計(jì)算出每個(gè)被測(cè)試的評(píng)分,得出驗(yàn)證集ROC曲線,利用訓(xùn)練集中所得到的閾值,判斷模型在驗(yàn)證集上的預(yù)測(cè)效能。
圖1 采用LASSO 10折交叉驗(yàn)證圖。a)用10倍交叉驗(yàn)證的方法尋找LASSO的超參數(shù)lambda,模型偏差最低點(diǎn)對(duì)應(yīng)的橫坐標(biāo)為最優(yōu)的lambda值,即第一個(gè)虛線所在位置;b)圖中每條彩色的線代表特征的系數(shù)隨lambda值的變化曲線,通過圖a尋找到的lambda值(虛線代表的位置)來確定哪個(gè)參數(shù)的系數(shù)不為0,則該參數(shù)用于最后的模型構(gòu)建。
表2 LASSO降維為最后保留的特征表
5.統(tǒng)計(jì)分析
本研究采用R語(yǔ)言(Version 3.5.1,www.R-project.org)進(jìn)行統(tǒng)計(jì)學(xué)分析,“mRMRe”程序包采用最大相關(guān)最小冗余的方式對(duì)組學(xué)特征進(jìn)行初步篩選,保留10個(gè)有最大預(yù)測(cè)效能的特征,“glmnet”程序包用于選擇最佳的特征集合并進(jìn)行LASSO回歸分析,構(gòu)建影像組學(xué)模型。ROC分析是基于“pROC”程序包來評(píng)估模型預(yù)測(cè)PNI的效能?!癕odelGood”程序包用來進(jìn)行模型的校準(zhǔn)分析?!皉mda”程序包用于繪制決策曲線,驗(yàn)證模型的臨床價(jià)值。采用獨(dú)立樣本t檢驗(yàn)、χ2檢驗(yàn)及秩和檢驗(yàn)比較訓(xùn)練集、驗(yàn)證集和PNI組和無(wú)PNI組年齡、性別、CEA的差異。以P< 0.05為差異具有統(tǒng)計(jì)學(xué)意義。
1.患者一般資料分析
訓(xùn)練集72例,驗(yàn)證集38例,兩組年齡(65.6±9.7歲,64.4±9.8歲,t=0.363,P=0.719)、性別(男女比例50:22和26:12,χ2=0.012,P=0.912)、CEA[2.86(1.49,4.84)ng/mL,3.20(2.14,6.37)ng/mL,Z=-0.0990,P=0.322]差異均無(wú)統(tǒng)計(jì)學(xué)意義。術(shù)后病理提示有PNI的患者24例,無(wú)PNI的患者86例,PNI組和無(wú)PNI組兩組間年齡(63.9±12.1歲,64.9±9.0歲,t=0.423,P=0.673)、性別(男女比例57:27和9:7,χ2=0.253,P=0.615)、CEA[3.20(1.94,4.88)ng/mL,2.90(1.68,6.12)ng/mL,Z=-0.004,P=0.997]差異無(wú)統(tǒng)計(jì)學(xué)意義。
2.構(gòu)建放射組學(xué)預(yù)測(cè)模型
圖2 wilcoxon檢驗(yàn)。兩組P值均<0.05,兩組差異具有統(tǒng)計(jì)學(xué)意義。
首先采用最大相關(guān)最小冗余的方式對(duì)組學(xué)特征進(jìn)行初步篩選,保留10個(gè)有最大預(yù)測(cè)效能的特征,然后將剩余的影像特征作LASSO回歸分析,通過10折交叉驗(yàn)證篩選LASSO回歸模型的最優(yōu)超參數(shù)lambda值(圖1)。LASSO降維為最后保留的特征見表2,特征系數(shù)絕對(duì)值越大,表明該特征與PNI之間的關(guān)系越大,預(yù)測(cè)價(jià)值越大。
3.計(jì)算影像組學(xué)模型的預(yù)測(cè)效能
Radscore是由模型構(gòu)建的特征乘以對(duì)應(yīng)的系數(shù)之和所得到,其公式為“Radscore=截距+βi·Xi”,按這個(gè)公式分別計(jì)算每一個(gè)樣本的Radscore;并由樣本的Radscore根據(jù)閾值對(duì)樣本進(jìn)行分類,評(píng)分大于閾值的樣本歸為一類,小于閾值的樣本歸為另一類,wilcoxon檢驗(yàn)兩組P值均<0.05,兩組分類差異具有統(tǒng)計(jì)學(xué)意義(圖2)。
Radscore=0.163*Correlation_angle135_offset7+-0.299*HighGreyLevelRunEmphasis_AllDirection_offset7_SD+0.339*LongRunLowGreyLevelEmphasis_AllDirection_offset1_SD+0.331*RunLengthNonuniformity_AllDirection_offset7_SD+-0.334*InverseDifferenceMoment_AllDirection_offset7_SD+0.448*ClusterProminence_angle135_offset7+0.282*LongRunHighGreyLevelEmphasis_AllDirection_offset1_SD+-0.647*ClusterShade_AllDirection_offset1_SD+-0.109*RunLengthNonuniformity_AllDirection_offset4_SD+-0.028
繪制該模型預(yù)測(cè)PNI的ROC曲線(圖3),計(jì)算閾值時(shí)訓(xùn)練集和驗(yàn)證集的效能,訓(xùn)練集曲線下面積(area under the curve,AUC)為0.79,驗(yàn)證集AUC為0.76。
該模型的臨床應(yīng)用價(jià)值,決策曲線分析(decision curve analysis,DCA)顯示閾值在0. 2~1較大的范圍內(nèi),模型的凈收益較大(圖4),在這個(gè)閾值范圍內(nèi)使用模型來預(yù)測(cè)PNI相對(duì)安全。
直腸癌術(shù)后病理提示PNI是術(shù)后病理診斷的一個(gè)內(nèi)容,多項(xiàng)研究證實(shí)直腸癌患者PNI與較差的預(yù)后相關(guān)[4-9]。有PNI的直腸癌患者較無(wú)PNI的直腸癌患者總生存率(overall survival,OS)降低,無(wú)病生存率(disease free survival,DFS)降低,局部復(fù)發(fā)率(local recurrence,LR)增高。
一項(xiàng)納入269例直腸癌切除術(shù)后生存分析的單中心回顧性研究發(fā)現(xiàn),無(wú)PNI的患者較PNI患者的5年生存率提高了4倍[8]。Quah等[9]對(duì)448例II期直腸癌患者進(jìn)行長(zhǎng)期隨訪,中位隨訪時(shí)間約53個(gè)月,多變量分析顯示PNI患者的5年DFS顯著低于無(wú)PNI的患者(29% vs. 82%,P=0.0005)。III期的直腸癌患者有與上述研究類似的結(jié)果[7]。
一項(xiàng)納入58項(xiàng)研究的22900例直腸癌患者的Meta分析[4]結(jié)果表明PNI與LR增加、5年無(wú)病生存率(5-year disease free survival,5yDFS)減少、5年癌癥特異性生存率(5-year cancer-specific survival,5yCSS)減少和5年總生存率(5-year overall survival,5yOS)減少相關(guān),多因素分析顯示PNI是5yDFS,5yCSS和5yOS的獨(dú)立預(yù)后因素。
圖3 該模型預(yù)測(cè)PNI的ROC曲線。a)驗(yàn)證集;b)訓(xùn)練集。
圖4 該模型的DCA。橫坐標(biāo)為閾值概率,綠色曲線表示所有樣本都為陽(yáng)性,都接受干預(yù),黑色水平線表示所有樣本都為陰性,不做任何干預(yù);藍(lán)色曲線表示閾值在0. 2~1較大的范圍內(nèi),模型的凈收益大于其它兩種情況。
目前術(shù)前用現(xiàn)有的影像方法評(píng)估預(yù)測(cè)PNI相關(guān)研究較少。放射組學(xué)是目前新興的研究熱點(diǎn),通過提取高通量的影像特征,分析其與疾病異質(zhì)性的相關(guān)性,構(gòu)建預(yù)測(cè)疾病異質(zhì)性的模型[12-15]。如Park等[12]將294例接受術(shù)前MRI檢查的浸潤(rùn)性乳腺癌患者隨機(jī)分為訓(xùn)練組(n=194)和驗(yàn)證組(n=100),基于訓(xùn)練集中的彈性網(wǎng)絡(luò)回歸生成Rad-score,最終構(gòu)建了結(jié)合Rad-score、MRI及臨床病理學(xué)特征的放射組學(xué)列線圖,結(jié)果顯示在訓(xùn)練組和驗(yàn)證組中,較高的Rad評(píng)分與較差的DFS顯著相關(guān)(P分別為0.002和0.036)。放射組學(xué)列線圖估計(jì)DFS(C指數(shù)0.76,95%CI為0.74~0.77)優(yōu)于臨床病理學(xué)(C指數(shù)0.72,95%CI為0.70~0.74)或僅有Rad評(píng)分的列線圖(C指數(shù)0.67,95%CI為0.65~0.69)[12]。Chen等研究回顧性分析487例病理診斷為非小細(xì)胞肺癌的增強(qiáng)CT圖像,每個(gè)患者提取了511個(gè)放射組學(xué)特征,最終構(gòu)建了基于9放射學(xué)特征的Rad-score,用于區(qū)分非小細(xì)胞肺癌的組織分化水平(訓(xùn)練集AUC=0.763,驗(yàn)證集AUC=0.782)[13]。Xu等[14]通過回顧性分析提取495名肝細(xì)胞癌患者的CT影像特征和臨床特征,建立一個(gè)在肝細(xì)胞癌術(shù)前預(yù)測(cè)微血管侵犯(microvascular invasion,MVI)的模型,訓(xùn)練集AUC為0.909,驗(yàn)證集AUC為0.889,多因素回歸分析顯示Radscore計(jì)算的MVI概率、組織學(xué)MVI、腫瘤大小和Edmondson-Steiner等級(jí)與疾病特異性復(fù)發(fā)和死亡率獨(dú)立相關(guān)。通過對(duì)諸如上述放射組學(xué)文獻(xiàn)的閱讀與思考,我們?cè)噲D通過構(gòu)建放射組學(xué)模型預(yù)測(cè)直腸癌PNI。本研究通過提取高通量的放射組學(xué)數(shù)據(jù),成功構(gòu)建有效穩(wěn)定可行的預(yù)測(cè)直腸癌PNI的模型,能較好的預(yù)測(cè)PNI,訓(xùn)練集AUC為0.79,驗(yàn)證集AUC為0.76。
本研究有以下不足之處,首先樣本量相對(duì)較少,尚待后期擴(kuò)充樣本量進(jìn)行進(jìn)一步研究;其次本研究中因所有入選患者均行TME,無(wú)T4期患者納入,無(wú)法評(píng)估該模型在T4期患者中預(yù)測(cè)價(jià)值;最后本研究選取高分辨率T2WI軸位最大截面勾畫病灶,非全體積,數(shù)據(jù)可能存在一定偏差。
總之,通過提取高通量的放射組學(xué)數(shù)據(jù),建立預(yù)測(cè)直腸癌PNI的模型,能較好的預(yù)測(cè)PNI,早期評(píng)估預(yù)后。