姜文研,崔林鵬,金 瑛,劉廣興,馬 超,羅婭紅
1.遼寧省腫瘤醫(yī)院(中國醫(yī)科大學(xué)腫瘤醫(yī)院)腫瘤防治辦公室,遼寧 沈陽 110042 ;
2.中國醫(yī)科大學(xué)生物醫(yī)學(xué)工程系,遼寧 沈陽110122 ;
3.遼寧省計(jì)劃生育科學(xué)研究院,遼寧 沈陽 110031;
4.遼寧省腫瘤醫(yī)院(中國醫(yī)科大學(xué)腫瘤醫(yī)院)醫(yī)學(xué)影像科,遼寧 沈陽 110042
宮頸癌已成為世界第四大女性惡性腫瘤,在全球因癌癥死亡女性中占8%[1],中國每年新發(fā)和死亡患者分別可達(dá)10萬和4萬例[2]。宮頸癌淋巴血管間隙浸潤(lymph-vascular space invasion,LVSI)是癌細(xì)胞侵襲進(jìn)入淋巴管和血管的一種典型癥狀,與宮頸癌遠(yuǎn)端轉(zhuǎn)移密切相關(guān),對于早期宮頸癌治療策略的選擇尤為重要[3-4]。有研究[5]表明,宮頸癌LVSI患者的5年生存率僅約16.5%。當(dāng)前,臨床上對LVSI的評價(jià)依賴術(shù)中冷凍切片快速病理學(xué)檢查,相對于臨床檢查與影像學(xué)檢查相結(jié)合的國際婦產(chǎn)科聯(lián)盟(International Federation of Gynecology and Obstetrics,F(xiàn)IGO)術(shù)前分期而言,具有明顯遲滯性,這主要是因?yàn)槟壳吧腥狈︶槍VSI的影像學(xué)特征性標(biāo)志,影像科醫(yī)師無法通過肉眼閱片對患者的LVSI狀態(tài)進(jìn)行判斷[6]。
磁共振成像(magnetic resonance imaging,MRI)具有極高的軟組織分辨力和無骨性偽影等優(yōu)勢,已被廣泛應(yīng)用于宮頸癌的各項(xiàng)臨床診斷[7]。其中,T1對比增強(qiáng)(T1 contrastenhanced,T1CE)MRI影像能夠顯示病變的強(qiáng)化程度及與周圍正常宮頸壁的強(qiáng)化對比;T2加權(quán)成像(T2-weighted imaging,T2WI)MRI影像則有利于展現(xiàn)病灶形態(tài)、位置和浸潤范圍。正是由于上述兩種MRI成像方式能分別反映出疾病的不同表象,因此聯(lián)合T1CE和T2WI MRI影像對宮頸癌進(jìn)行聯(lián)合診斷是當(dāng)前的一個(gè)熱門研究方向[8]?;谟跋窠M學(xué)的醫(yī)學(xué)人工智能技術(shù)通過對臨床采集的醫(yī)學(xué)影像提取定量特征并降維篩選后,利用定量化特征建立影像組學(xué)計(jì)算機(jī)模型,可以揭示影像與病理學(xué)信息之間的深層次關(guān)聯(lián)性[9-10],有助于輔助臨床醫(yī)師對患者進(jìn)行診斷和預(yù)后預(yù)測等工作。當(dāng)前已有使用計(jì)算機(jī)輔助方法分析臨床MRI影像[11-12],但針對宮頸癌LVSI的輔助診斷預(yù)測則鮮見報(bào)道。近期的一項(xiàng)最新研究[13]表明,使用單序列MRI影像能夠?qū)m頸癌LVSI狀態(tài)進(jìn)行初步預(yù)測且準(zhǔn)確度達(dá)到60%。雖然該報(bào)道的預(yù)測準(zhǔn)確度較低,尚不具有為臨床醫(yī)師提供輔助的應(yīng)用價(jià)值,但提示MRI影像中包含可用于宮頸癌LVSI預(yù)測的有效信息。因此,為了進(jìn)一步探索雙序列MRI影像聯(lián)合對宮頸癌LVSI的預(yù)測價(jià)值,我們采集了早期宮頸癌患者的雙序列MRI數(shù)據(jù)進(jìn)行融合分析,以期建立具有一定臨床輔助價(jià)值的計(jì)算機(jī)預(yù)測模型。
在遼寧省腫瘤醫(yī)院影像歸檔和通信系統(tǒng)(picture archiving and communication system,PACS)中收集整理2015年11月—2018年8月于遼寧省腫瘤醫(yī)院就診的151例女性患者的早期宮頸癌(ⅠA2~ⅡB期)MRI數(shù)據(jù)。其中經(jīng)病理學(xué)檢查證實(shí)為LVSI的患者有61例,非LVSI 90例。納入標(biāo)準(zhǔn):① 在病理學(xué)檢查前行盆腔MRI掃描;②經(jīng)病理學(xué)檢查確定是否發(fā)生LVSI;③ 年齡>18歲;④ 術(shù)前FIGO分期為早期宮頸癌(ⅠA2~ⅡB期)。排除標(biāo)準(zhǔn):① 處于孕期;② 進(jìn)行過宮頸錐切術(shù)或環(huán)形電切術(shù)治療;③ 有放化療史;④患有除宮頸癌以外的其他腫瘤疾病;⑤ 影像學(xué)圖像模糊或有偽影。本研究通過遼寧省腫瘤醫(yī)院醫(yī)學(xué)倫理委員會(huì)的批準(zhǔn)。
宮頸癌MRI影像的掃描在遼寧省腫瘤醫(yī)院醫(yī)學(xué)影像科進(jìn)行。采用德國Siemens公司的Magnetom Verio 3.0 T核磁共振掃描儀,使用腹部8通道相控陣線圈。T2WI MRI掃描參數(shù):重復(fù)時(shí)間(repetition time,TR)/回波時(shí)間(echo time,TE)為550 ms/13 ms;層厚5.0 mm;層間距1 mm;視野400 mm×400 mm;采集矩陣320×320。T1CE MRI掃描參數(shù)為:TR/TE為5.08 ms/1.74 ms;以3.0 mL/s的速度靜脈推注對比劑釓噴酸葡胺注射液劑量0.1 mmol/kg,然后推注20.0 mL 0.9%NaCl溶液。全部患者采用相同的參數(shù)和體位進(jìn)行掃描,掃描開始前患者需大量飲水以充盈膀胱。掃描得到的MRI影像儲(chǔ)存于遼寧省腫瘤醫(yī)院PACS,由2名有10年以上診斷經(jīng)驗(yàn)的放射科醫(yī)師使用公開軟件ITK-SNAP(version 3.6,www.itk-snap.org)對影像中的感興趣區(qū)(region of interest,ROI)進(jìn)行勾畫,貼近腫瘤病灶邊界并避開宮頸管黏液。當(dāng)腫瘤邊界不清晰時(shí),多個(gè)序列互相參照,確定腫瘤邊界。如有分歧,由有15年以上經(jīng)驗(yàn)的放射科醫(yī)師決定勾畫結(jié)果。醫(yī)師在勾畫ROI時(shí)不知道患者的病理學(xué)診斷結(jié)果。
對醫(yī)師勾畫的ROI,使用Python語言開源的Pyradiomics包[14]提取特征,包括18個(gè)一階統(tǒng)計(jì)學(xué)特征,14個(gè)形狀特征,75個(gè)紋理特征,以及Pyradiomics包提供的8種濾波圖像特征。75個(gè)紋理特征分別為24個(gè)灰度共生矩陣特征(gray level cooccurence matrix,GLCM),16個(gè)灰度級游程長度矩陣(gray level run length matrix,GLRLM)特征,16個(gè)灰度級區(qū)域矩陣(gray level size zone matrix,GLSZM)特征,5個(gè)相鄰灰度差矩陣(neighboring gray tone difference matrix,NGTDM)特征,14個(gè)灰度級相關(guān)矩陣(gray level dependence matrix,GLDM)特征。特征篩選分為3步,首先使用單變量曲線下面積(area under curve,AUC)分析,保留AUC大于0.6的特征,然后使用五折交叉驗(yàn)證的最低絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸算法[15]進(jìn)一步進(jìn)行特征篩選,最后使用最小冗余最大相關(guān)性(max-relevance and min-redundancy,mRMR)算法去除特征間相關(guān)性高的冗余特征。五折交叉驗(yàn)證的LASSO 算法使用R語言glmnet包的cv.glmnet函數(shù)實(shí)現(xiàn),mRMR算法使用R語言mRMRe包實(shí)現(xiàn)。
使用篩選后的特征構(gòu)建logistic分類器,獲得組學(xué)標(biāo)簽公式,再使用R語言的rms包(version 3.5.1)建立和繪制諾模圖(也叫列線圖)模型。通過繪制校正曲線評價(jià)諾模圖的預(yù)測能力,通過決策曲線分析計(jì)算閾值概率范圍內(nèi)凈效益,從而對所建立的諾模圖模型在臨床應(yīng)用中的價(jià)值進(jìn)行評估。
為了衡量構(gòu)建的計(jì)算機(jī)模型對宮頸癌LVSI的預(yù)測能力,繪制模型的受試者工作特征(receiver operating characteristic,ROC)曲線,并計(jì)算AUC、特異度和靈敏度。ROC曲線的最佳截?cái)嘀涤勺畲蠹s登指數(shù)計(jì)算得到[16]。
圖1所示為本研究收集的早期宮頸癌患者雙序列MRI影像和手工勾畫的ROI,圖中黃色線條為沿著腫瘤病灶邊緣進(jìn)行勾畫的痕跡,在黃色線條內(nèi)部區(qū)域提取影像組學(xué)特征。
圖1 早期宮頸癌患者M(jìn)RI影像和勾畫的ROI
先通過單變量AUC分析篩選出AUC大于0.60的影像學(xué)特征,再通過LASSO算法進(jìn)行特征篩選,共獲得12個(gè)診斷力強(qiáng)的影像學(xué)特征(圖2),最后使用mRMR算法去除冗余特征,篩選出的6個(gè)特征(表1)的特征間相關(guān)性最小,預(yù)測能力最強(qiáng)。6個(gè)特征中有5個(gè)屬于小波特征,1個(gè)屬于拉普拉斯-高斯(Laplacian of Gaussian,LoG)特征。篩選出的6個(gè)特征用于構(gòu)建logistic分類器,建立預(yù)測模型。組學(xué)標(biāo)簽公式MRI評分=-0.515 0+0.424 1×特征1+0.434 9×特征2-0.669 7×特征3-0.522 0×特征4-0.601 6×特征5+0.373 1×特征6。
表1 T1CE和T2WI MRI序列篩選獲得的影像組學(xué)特征
圖2 通過LASSO算法對MRI影像特征進(jìn)行篩選
表2展示了6個(gè)影像學(xué)特征的均值、標(biāo)準(zhǔn)差及t檢驗(yàn)P值和AUC,6個(gè)影像學(xué)特征的差異有統(tǒng)計(jì)學(xué)意義(P均<0.05),AUC均大于0.60,表明對宮頸癌LVSI具有較好的預(yù)測能力。
表2 通過特征篩選獲得的6個(gè)影像組學(xué)特征的統(tǒng)計(jì)分析 ±s
表2 通過特征篩選獲得的6個(gè)影像組學(xué)特征的統(tǒng)計(jì)分析 ±s
影像學(xué)特征 數(shù)據(jù)集 非LVSI LVSI P值 AUC特征1 訓(xùn)練集 4.222±2.363 5.832±3.624 <0.010 0.629測試集 4.817±2.975 6.394±2.921 0.166 0.714特征2 訓(xùn)練集 4.256±1.336 5.748±2.648 <0.010 0.669測試集 4.429±1.323 5.087±1.800 0.254 0.623特征3 訓(xùn)練集 8.733±2.429 7.708±1.414 <0.010 0.638測試集 8.931±2.406 7.549±1.515 0.096 0.695特征4 訓(xùn)練集 -0.033±0.005 -0.036±0.004 0.023 0.654測試集 -0.037±0.010 -0.035±0.004 0.588 0.523特征5 訓(xùn)練集 0.261±0.003 0.260±0.001 <0.010 0.662測試集 0.260±0.004 0.260±0.001 0.597 0.505特征6 訓(xùn)練集 0.576±0.112 0.625±0.108 0.018 0.613測試集 0.605±0.107 0.641±0.106 0.368 0.618
圖3所示為聯(lián)合雙序列影像學(xué)特征建立的早期宮頸癌LVSI風(fēng)險(xiǎn)諾模圖預(yù)測模型。每例患者LVSI風(fēng)險(xiǎn)值的計(jì)算方式:MRI評分通過基于T1CE和T2WI序列的影像學(xué)特征及系數(shù)計(jì)算得到,在相應(yīng)的點(diǎn)垂直于MRI評分軸向分?jǐn)?shù)軸(Points)作一條直線,最終與模型底部風(fēng)險(xiǎn)軸(Risk)相交,獲得該患者的LVSI總風(fēng)險(xiǎn)值。圖4A和圖4B所示為模型的校正曲線,曲線的橫縱軸分別為模型計(jì)算的LVSI風(fēng)險(xiǎn)值和病理學(xué)檢查結(jié)果(真實(shí)標(biāo)簽)。圖中虛線為模型的預(yù)測結(jié)果,與經(jīng)原點(diǎn)的45°斜線越貼近說明模型預(yù)測效果越好。ROC曲線(圖4C、D)表明模型在訓(xùn)練集和測試集上獲得了良好的AUC值,分別為0.812和0.775。
圖3 用于預(yù)測早期宮頸癌LVSI的諾模圖模型
圖4 諾模圖模型的校正曲線和ROC曲線
模型的決策曲線繪制如圖5所示,曲線的縱軸和橫軸分別為模型的凈獲益率和閾值概率,底部黑色直線為假定患者都沒有發(fā)生LVSI,藍(lán)色曲線為假定患者都發(fā)生LVSI,紅色曲線為本研究建立的模型。當(dāng)閾值概率范圍在0.07~0.77時(shí),模型對早期宮頸癌患者有良好獲益。
圖5 基于諾模圖模型的宮頸癌LVSI決策曲線分析
隨著醫(yī)療水平提升,早期宮頸癌患者的治療效果整體較好,但LVSI往往與淋巴結(jié)轉(zhuǎn)移風(fēng)險(xiǎn)顯著相關(guān),預(yù)示著較差的預(yù)后[17],因此是臨床上制訂治療方案的重要影響因素。已有研究[18]表明,傳統(tǒng)的MRI影像分析方法能通過對腫瘤子宮體積比等影像學(xué)特征進(jìn)行分析,從而在一定程度上預(yù)測子宮內(nèi)膜癌LVSI,但忽略了腫瘤內(nèi)部特征和高維度信息。2019年,Li等[13]首次嘗試使用影像組學(xué)方法通過單序列MRI對LVSI進(jìn)行預(yù)測,雖然僅使用影像數(shù)據(jù)建立模型獲得的預(yù)測AUC僅為0.60,但該研究首次提示MRI影像中含有早期宮頸癌LVSI的影像學(xué)標(biāo)志信息。本研究中,為了進(jìn)一步探索多序列MRI影像對LVSI的預(yù)測價(jià)值,我們同時(shí)納入了T1CE和T2WI兩個(gè)MRI序列數(shù)據(jù)。T1CE影像能通過微血管密度和灌注信息反映腫瘤微環(huán)境與侵襲情況,而T2WI影像則利于提供腫瘤形態(tài)信息和間質(zhì)情況。通過聯(lián)合這兩個(gè)MRI序列,能夠進(jìn)一步提高計(jì)算機(jī)模型對LVSI的預(yù)測能力。
為構(gòu)建預(yù)測模型,本研究分別對兩個(gè)MRI序列的ROI提取特征,然后進(jìn)行三步特征選擇方法篩選出最優(yōu)特征子集。特征篩選第二步在使用五折交叉驗(yàn)證的LASSO算法,計(jì)算其交叉驗(yàn)證損失時(shí),測量方法選擇了只用于二分類logistic回歸的AUC,而沒有用均方誤差。圖2A第一條虛線處表明AUC最大值,第二條虛線是AUC最大值的一倍標(biāo)準(zhǔn)差的位置。本研究選擇在AUC最大值的一倍標(biāo)準(zhǔn)差的情況下,得到特征數(shù)量更少的特征子集用于構(gòu)建分類器。最終篩選出的6個(gè)診斷力較強(qiáng)的特征有2個(gè)來自于T1CE序列影像學(xué)特征,均屬于小波特征,有4個(gè)來自于T2WI序列影像學(xué)特征,其中有3個(gè)屬于小波特征,另外1個(gè)屬于LoG特征。我們的研究結(jié)果或許可以解釋影像科醫(yī)師無法利用MRI影像對宮頸癌LVSI進(jìn)行判斷的原因,是由于這些診斷力強(qiáng)的影像學(xué)特征標(biāo)志信息均存在于時(shí)域之外的高維度空間,人類是難以對其洞察和理解的。T1CE序列的wavelet_HHH_glszm_SizeZoneNonUniformity特征測量整個(gè)ROI體積的變異性,較高的值表示異質(zhì)性更高。T1CE序列的特征wavelet_LLH_firstorder_Kurtosis,峰度表示ROI的像素值分布的峰值高低,描述ROI像素值分布的陡緩程度。峰度越高,像素值的分布越集中在尾部而不是接近均值的峰值處,其方差越大,異質(zhì)性程度越高。由表2可知,相比于LVSI組,非LVSI組患者的T1CE序列的兩個(gè)特征的平均值都較低,且差異有統(tǒng)計(jì)學(xué)意義。可能由于非LVSI組患者的宮頸腫瘤異質(zhì)性較低,所以,發(fā)生LVSI的概率也相應(yīng)較低。LoG特征中的σ值定義了計(jì)算機(jī)模型所關(guān)注的影像中的紋理粗糙度,由于我們從T2WI序列中獲得的LoG特征的σ值較?。?),表明模型更關(guān)注于影像中的精細(xì)紋理(短距離變化)。
為了建立對臨床輔助診斷有價(jià)值的預(yù)測模型,我們繪制了影像組學(xué)諾模圖,這是一種醫(yī)學(xué)影像領(lǐng)域近年來廣泛使用的直觀模型方法。本研究利用雙序列MRI影像學(xué)特征建立的諾模圖模型對LVSI進(jìn)行預(yù)測,測試集AUC值達(dá)到0.775,且特異度(0.759)和靈敏度(0.765)均較好,表明模型的漏診率和誤診率較低。本研究結(jié)果明顯好于2019年最新的類似研究報(bào)道[13],可能的原因是該報(bào)道僅使用了T1CE序列,而本研究篩選獲得的特征中絕大部分(4個(gè))都是來自于額外納入的T2WI序列,表明T2WI序列對于宮頸癌LVSI有較高的診斷價(jià)值。此外,我們使用的是3.0 T MRI,而前期報(bào)道使用的是1.5 T MRI,因此本研究建立的計(jì)算機(jī)模型能獲得更準(zhǔn)確的診斷特征。決策曲線分析表明,本研究提出的模型具有較好的臨床應(yīng)用潛力。
本研究存在以下局限性:① 本研究提取和分析了影像組學(xué)手工影像學(xué)特征,沒有引入基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)特征,在未來的研究中,擬采用手工特征與深度學(xué)習(xí)特征相融合建立預(yù)測模型;② 本研究未引入DLL4、GINS2等臨床分子生物學(xué)標(biāo)志物建立聯(lián)合預(yù)測模型;③ 本研究使用的MRI影像數(shù)據(jù)均采集自同一家醫(yī)院,可能存在一定的偏倚,在下一步的研究中,擬聯(lián)合多家醫(yī)院進(jìn)行多中心驗(yàn)證,從而驗(yàn)證所建立計(jì)算機(jī)預(yù)測模型的魯棒性。
本研究采集在遼寧省腫瘤醫(yī)院就診的早期宮頸癌患者的雙序列MRI影像,使用影像組學(xué)方法進(jìn)行了特征提取和篩選,并建立了諾模圖計(jì)算機(jī)輔助分析模型。研究結(jié)果表明,建立的模型可對LVSI進(jìn)行有效預(yù)測,模型的特異度和靈敏度也較為理想,為臨床上針對早期宮頸癌LVSI的影像學(xué)預(yù)測提供了一種新的技術(shù)思路,具有廣闊的應(yīng)用前景。