張一鴻,侯瑩,包婕,王成龍,宋陽(yáng)*,張玉東,楊光
作者單位:1.華東師范大學(xué)上海市磁共振重點(diǎn)實(shí)驗(yàn)室,上海200062;2.南京醫(yī)科大學(xué)第一附屬醫(yī)院,南京210029;3.蘇州大學(xué)第一附屬醫(yī)院,蘇州215006
前列腺癌是美國(guó)男性發(fā)病率第一,病死率第二的癌癥,其準(zhǔn)確診斷是制訂最佳治療計(jì)劃的保障[1,2]。前列腺癌發(fā)生包膜侵犯與根治性前列腺切除術(shù)后總生存率下降相關(guān)[3]。傳統(tǒng)經(jīng)直腸超聲引導(dǎo)的活檢往往低估了腫瘤的分期,導(dǎo)致預(yù)測(cè)不準(zhǔn)確[4-6]。研究表明,多參數(shù)磁共振成像對(duì)包膜侵犯的檢測(cè)是有效的[7-9]。然而,傳統(tǒng)基于磁共振成像的研究,也不能準(zhǔn)確地判斷侵犯發(fā)生,特別是對(duì)處于頂部的癌灶,特異度只有30%左右[10,11]。
影像組學(xué)[12]是一種通過(guò)分析圖像ROI,提取定量特征,并對(duì)特征進(jìn)行統(tǒng)計(jì)分析的方法,近幾年被廣泛運(yùn)用于醫(yī)學(xué)影像研究之中[13,14]。在前列腺癌包膜侵犯方面,主要是針對(duì)癌灶內(nèi)的特征進(jìn)行分析[15,16]。但包膜侵犯的發(fā)生,與癌灶和腺體包膜的位置有關(guān),僅研究一個(gè)區(qū)域不能反映兩者關(guān)系。所以本文通過(guò)提取可能侵犯區(qū)域的組學(xué)特征,建立組學(xué)模型對(duì)前列腺癌是否發(fā)生包膜侵犯進(jìn)行預(yù)測(cè)。相較于單一組織特征的模型,本文所建立的模型能獲得更好的診斷效果。
本研究回顧性分析了2015 年1 月至2019 年6 月在南京醫(yī)科大學(xué)第一附屬醫(yī)院進(jìn)行磁共振掃描的病例,并通過(guò)醫(yī)院的倫理委員會(huì)批準(zhǔn)(批準(zhǔn)文號(hào):2016-SRFA-093),免除受試者知情同意。數(shù)據(jù)納入標(biāo)準(zhǔn):(1)前列腺癌癥患者進(jìn)行了根治性前列腺切除術(shù);(2)術(shù)前4周內(nèi)進(jìn)行標(biāo)準(zhǔn)前列腺M(fèi)RI檢查;(3)磁共振檢查圖像包括T2加權(quán)成像、彌散加權(quán)成像和對(duì)應(yīng)的ADC圖像。排除標(biāo)準(zhǔn):(1)既往有前列腺癌手術(shù)史;(2)進(jìn)行過(guò)前列腺癌輔助治療(良性前列腺增生或膀胱外梗阻的干預(yù)被認(rèn)為是可接受的)。最后納入718 例患者,其中未發(fā)生侵犯的527 例,發(fā)生侵犯的191 例。按照訓(xùn)練集和測(cè)試集比例4∶1隨機(jī)對(duì)數(shù)據(jù)拆分,得到訓(xùn)練集數(shù)據(jù)574例,測(cè)試集144例。
所有數(shù)據(jù)均使用德國(guó)西門子公司的3.0 T 磁共振掃描儀Skyra。掃描參數(shù):T2WI:TE=105 ms,TR=6000 ms,層厚=3.5 mm,掃描矩陣=384×384;DWI:TE=82 ms,TR=6000 ms,層厚=3.5 mm,掃描矩陣=128×128,含有 0、100、250、500、1000、1500、2000 mm2/s等多個(gè)b值。ADC由DWI單指數(shù)擬合模型計(jì)算得到。
兩位經(jīng)驗(yàn)豐富的影像科醫(yī)師使用3D Slicer,對(duì)前列腺腺體和癌灶部分進(jìn)行手動(dòng)勾畫,得到腺體和癌灶的ROI。由于包膜侵犯是發(fā)生在癌灶與腺體包膜接觸的區(qū)域,本研究基于腺體ROI和癌灶ROI,根據(jù)以下規(guī)則生成注意力ROI,反映可能發(fā)生包膜侵犯的區(qū)域:(1)對(duì)于在癌灶內(nèi)部,且在前列腺腺體以外的體素,賦予最大注意力值1.0;(2)對(duì)于在癌灶以內(nèi),腺體以內(nèi)的體素,根據(jù)體素到腺體包膜的距離r,賦予注意力α/r 的注意力值,其中α 是調(diào)節(jié)參數(shù),本實(shí)驗(yàn)中選取0.5,即圖像分辨率;(3)對(duì)上述兩步生成的區(qū)域往外做衰減直到像素值為0。
使用荷蘭鹿特丹伊拉斯謨醫(yī)療中心研發(fā)的Elastix 工具包[17]將ADC 圖像配準(zhǔn)至T2 圖像上,進(jìn)行重采樣操作,使得層內(nèi)分辨率為0.5 mm×0.5 mm。對(duì)生成的注意力圖,使用閾值從0.1 至0.5 以0.1 為間隔進(jìn)行二值化操作,當(dāng)閾值大于0.5 之后,注意力ROI 的范圍太小,不利于特征提取。由于包膜侵犯發(fā)生在癌灶與包膜接觸的位置,可以重點(diǎn)分析腺體包膜內(nèi)外差異,受影像組學(xué)中微環(huán)境(Habitats)[18]啟發(fā),本研究將二值化后的注意力ROI劃分為前列腺腺體區(qū)域(prostate,Pro)、前列腺癌區(qū)域(prostate cancer,PCa)和周圍組織背景區(qū)域(background,BG)(圖1)。分別對(duì)上述ROI 提取形狀特征14 個(gè)、T2 圖像和ADC圖像的灰度特征各18個(gè)。
圖1 實(shí)驗(yàn)流程圖Fig.1 The workflow of out study
由于數(shù)據(jù)正負(fù)樣本比例約為1∶3,本研究采用合成少數(shù)過(guò)采集術(shù)(synthetic minority oversampling technique,SMOTE)算法平衡樣本。使用Z-Score 和Mean標(biāo)準(zhǔn)化的方法進(jìn)行特征歸一化,皮爾森相關(guān)系數(shù)(Pearson correlation coefficients, PCC)對(duì)數(shù)據(jù)進(jìn)行降維,特征遞歸消除(recursive feature elimination,RFE)和KW (Kruskal-Wallis test)的方法對(duì)降維后的特征進(jìn)行進(jìn)一步選擇,除去對(duì)結(jié)果貢獻(xiàn)小的特征。使用支持向量機(jī)(support vector machine,SVM)、線性判別分析(linear discriminant analysis,LDA)和線性回歸(linear regression,LR)作為分類器。運(yùn)用5 折交叉驗(yàn)證選取最優(yōu)模型參數(shù)。使用單位標(biāo)準(zhǔn)差(one-standard error,1-SE)方法進(jìn)行模型選擇,模型用獨(dú)立測(cè)試集評(píng)估。
以上特征提取和建模操作,使用開(kāi)源軟件FeAture Explorer (FAE) v 0.3.6進(jìn)行操作[19]。
本文使用ROC曲線和AUC來(lái)衡量模型的預(yù)測(cè)結(jié)果,并用Bootstrap 方法計(jì)算95%置信區(qū)間(confidence interval,CI)。同時(shí)還計(jì)算了敏感度、特異度、陽(yáng)性率和陰性率,并使用決策曲線分析(decision curve analysis,DCA)比較模型之間收益差異。
統(tǒng)計(jì)學(xué)分析使用Python 3.6和Scipy 1.3,年齡和前列腺特異性抗原(prostate specific antigen,PSA)使用曼-惠特尼U檢驗(yàn),病理Gleason 評(píng)分(biology Gleason Score,bGS)和病理侵犯統(tǒng)計(jì)數(shù)量及占比,使用χ2檢驗(yàn),來(lái)計(jì)算訓(xùn)練集和測(cè)試集之間的統(tǒng)計(jì)分布。模型預(yù)測(cè)結(jié)果之間的差異使用威爾科克森符號(hào)秩檢驗(yàn)。P<0.05表示差異具有統(tǒng)計(jì)學(xué)意義。
718 例患者的訓(xùn)練集和測(cè)試集數(shù)據(jù)的詳細(xì)臨床信息見(jiàn)表1,訓(xùn)練集數(shù)據(jù)和測(cè)試集數(shù)據(jù)臨床信息差異無(wú)統(tǒng)計(jì)學(xué)意義。
表1 訓(xùn)練集和測(cè)試集患者臨床信息Tab.1 Clinical information of patients in the training and test cohorts
2.2.1 閾值選擇
使用不同閾值對(duì)注意力ROI進(jìn)行二值化,用交叉驗(yàn)證的方式進(jìn)行建模比較,橫向?qū)Ρ乳撝祵?duì)訓(xùn)練集結(jié)果的影響,發(fā)現(xiàn)訓(xùn)練集的AUC表現(xiàn)類似,見(jiàn)圖2。根據(jù)奧卡姆剃刀原則[20],選取特征數(shù)最少對(duì)應(yīng)的模型,即閾值選取0.2。
圖2 不同閾值注意力ROⅠ的建模結(jié)果。A:不同閾值模型的ROC曲線;B:不同模型AUC的箱型圖和建模使用的特征數(shù)量,其中箱線圖表示模型的AUC統(tǒng)計(jì)(左軸),綠色折線表示特征數(shù)(右軸) 圖3 測(cè)試集結(jié)果。圖A展示了測(cè)試集在腺體ROⅠ、癌灶ROⅠ、注意力ROⅠ和注意力ROⅠ子區(qū)域四個(gè)模型的ROC曲線;圖B為這四個(gè)模型的DCA曲線Fig. 2 Model results built by attention ROⅠwith different thresholds. A:The ROC curve of different threshold models;B:The box chart of AUC of different models(left axis),and the green plot of the number of selected features(right axis).Fig.3 Model performance on the test cohort.A denotes the ROC curves of the ModelPro,ModelPCa,ModelAtten,ModelRegion on the test cohort.B denotes the DCA curves of the four models.
2.2.2 模型結(jié)果
本研究同時(shí)使用癌灶ROI、腺體ROI、閾值0.2 的注意力ROI 和注意力ROI 子區(qū)域進(jìn)行建模,結(jié)果見(jiàn)表2。
表2 測(cè)試集在四個(gè)模型上的結(jié)果Tab.2 The results of the test cohorts on four models
當(dāng)使用腺體ROI建模時(shí),使用交叉驗(yàn)證和1-SE的方法進(jìn)行模型確立,結(jié)果發(fā)現(xiàn)使用Mean標(biāo)準(zhǔn)化方法、KW 特征選擇方法和SVM 分類器時(shí),選出16 個(gè)特征,模型在驗(yàn)證集上的效果較好(記為Mean-KW-16-SVM),此時(shí)訓(xùn)練集的AUC為0.740 (95%CI:0.690~0.788)、敏感度為0.603,特異度為0.787;測(cè)試集AUC 達(dá)到0.746 (95%CI:0.651~0.835)、敏感度為0.825,特異度為0.577。當(dāng)使用癌灶ROI 時(shí),選出的模型為Zscore-KW-12-LR,此時(shí)訓(xùn)練集AUC為0.742 (95%CI:0.693~0.790),敏感度為0.702、特異度為0.709;測(cè)試集的AUC為0.755 (95%CI:0.670~0.838)、敏感度和特異度分別為0.725和0.692。
使用注意力ROI時(shí),Mean-RFE-2-SVM的模型得到訓(xùn)練集AUC 為0.732 (95%CI:0.689~0.774),敏感度和特異度分別為0.722 和0.664,陽(yáng)性率和陰性率分別為0.434和0.870;測(cè)試集AUC為0.766 (95%CI:0.684~0.846),敏感度可以達(dá)到0.900,特異度0.529,陽(yáng)性率和陰性率分別為0.424和0.932。將注意力ROI中不同組分的特征分開(kāi)提取并組合建模,模型Mean-RFE-14-SVM 在訓(xùn)練集上的AUC 為0.794(95%CI:0.753~0.835),測(cè)試集上AUC 為0.792(95%CI:0.716~0.862)。訓(xùn)練集上敏感度特異度分別為0.695 和0.785,陽(yáng)性率和陰性率為0.536 和0.878。測(cè)試集上敏感度、特異度、陽(yáng)性率和陰性率分別為0.800、0.721、0.525和0.904。
四個(gè)模型在測(cè)試集上的ROC 曲線和DCA 曲線展示在圖3 中。子區(qū)域模型的AUC 最高,在概率閾值取0.2 至0.4 范圍內(nèi),子區(qū)域模型獲得的凈收益高于其他三個(gè)模型。
常規(guī)使用腺體ROI進(jìn)行組學(xué)分析時(shí),模型挑出的特征包含了T2 和ADC 的一階特征,但并沒(méi)有形狀特征。對(duì)癌灶ROI進(jìn)行特征提取建模,主要是形狀特征進(jìn)行了貢獻(xiàn),即通過(guò)分析癌灶形狀,可以輔助包膜侵犯診斷,特別是2D 最大直徑,在建模中權(quán)重占據(jù)最大。在使用注意力ROI進(jìn)行建模時(shí),只使用形狀特征的體積表面積比和ADC 的灰度最大值建模AUC 就可以達(dá)到0.766。注意力圖子區(qū)域建模,測(cè)試集AUC 達(dá)到了0.792,背景、腺體、癌灶的特征均有所貢獻(xiàn)。具體特征貢獻(xiàn)圖見(jiàn)圖4。
圖4 四個(gè)模型建模使用的特征及權(quán)重,其中A~D分別代表腺體模型、癌灶模型、注意力模型、子區(qū)域模型Fig. 4 The weights of features contributed in the model built by prostate gland,prostate cancer,generated attention,and the sub-regions of the attention were shown in figure A to D,respectively.
本研究通過(guò)前列腺腺體ROI 和癌灶ROI 生成注意力ROI,并受影像組學(xué)微環(huán)境的啟發(fā),將二值化后的注意力ROI分成背景、腺體和癌灶三個(gè)子ROI,分開(kāi)提取子ROI 的組學(xué)特征,經(jīng)過(guò)SMOTE 樣本均衡、Mean特征歸一化、PCC 降維、RFE 特征選擇后,使用SVM 建立模型,在測(cè)試集上得到AUC為0.792,說(shuō)明此方法可以較好地預(yù)測(cè)前列腺癌患者是否發(fā)生包膜侵犯。
相較于單純使用臨床信息,磁共振成像具有可以顯示癌灶位置和解剖學(xué)信息的優(yōu)勢(shì)[21]。除了跟臨床特征結(jié)合預(yù)測(cè)外,磁共振影像可以進(jìn)行特征提取,并建立組學(xué)模型對(duì)前列腺癌包膜侵犯進(jìn)行預(yù)測(cè)。Cuocolo等[22]對(duì)三個(gè)中心的前列腺癌患者的T2和ADC圖像癌灶內(nèi)部特征進(jìn)行提取,使用單一中心數(shù)據(jù)訓(xùn)練,另外兩個(gè)中心數(shù)據(jù)進(jìn)行測(cè)試,測(cè)試集AUC 分別為0.80 和0.73,模型表現(xiàn)與放射科醫(yī)生差異無(wú)統(tǒng)計(jì)學(xué)意義。Xu 等[23]在結(jié)構(gòu)像、彌散像和動(dòng)態(tài)增強(qiáng)圖像上分析癌灶特征,在115 個(gè)數(shù)據(jù)上建立LASSO (least absolute shrinkage and selection operator)模型,AUC達(dá)到0.865,但使用需要注入對(duì)比劑的動(dòng)態(tài)對(duì)比增強(qiáng)序列,增加了掃描成本。本研究?jī)H使用了T2 和ADC 的序列,橫向比較了多種建模方法,最高可以在獨(dú)立測(cè)試集上達(dá)到0.792 的AUC,說(shuō)明了基于磁共振成像的組學(xué)模型可以對(duì)包膜侵犯進(jìn)行預(yù)測(cè)。
前列腺癌包膜侵犯問(wèn)題,對(duì)于ROI的勾畫至關(guān)重要。Ma 等[15]對(duì)200 多例前列腺癌患者的T2 圖像的前列腺輪廓及輪廓內(nèi)約1 mm處進(jìn)行ROI的勾畫,并納入被懷疑是惡性或者有侵犯趨勢(shì)的癌灶部分,使得ROI內(nèi)部能更多地提取包膜的整體細(xì)微結(jié)構(gòu)特征,建立的模型在測(cè)試集上用LASSO 模型達(dá)到0.883 的AUC。Bai 等[16]對(duì)284 例的T2 和ADC 圖像進(jìn)行癌灶勾畫,將癌灶區(qū)域進(jìn)行擴(kuò)張并減去其中的直腸、尿道、膀胱得到癌灶周邊區(qū)域,對(duì)其進(jìn)行特征提取。癌灶區(qū)域、周邊區(qū)域和臨床特征分別和組合建模,癌灶周邊區(qū)域和臨床信息的結(jié)果最好,測(cè)試集上AUC 達(dá)到0.718。但這個(gè)過(guò)程是需要臨床醫(yī)生進(jìn)行手動(dòng)勾畫感興趣區(qū)域,勾畫結(jié)果依賴于醫(yī)生的臨床經(jīng)驗(yàn)。本研究使用的是自動(dòng)生成注意力圖的方式,借鑒了微環(huán)境的實(shí)現(xiàn)思路,將注意力圖劃分為更具有組織結(jié)構(gòu)信息的背景、癌灶、腺體等三個(gè)區(qū)域,分別進(jìn)行特征提取建模。
相比于其他學(xué)者影像組學(xué)的工作,本研究使用的特征主要是形狀特征和灰階特征,其原因是考慮到彌散序列的低分辨率和低信噪比,相比于紋理特征,形狀和灰階特征的魯棒性更好[24,25]。本研究的注意力圖模型驗(yàn)證發(fā)現(xiàn),不管是基于整體注意力ROI還是基于其子區(qū)域,最終結(jié)果表明體積表面積比和ADC圖像各組分的灰度值對(duì)前列腺癌的包膜侵犯的預(yù)測(cè)有較大的作用。原因可能是在注意力ROI生成時(shí),選擇的是癌灶與腺體邊界相近的部分,而腺體邊界通常類似于球形,如果癌灶沒(méi)有突破包膜,那么生成的注意力ROI很可能是月牙狀,體積表面積比較低。而各個(gè)組分在ADC圖像上的整體灰度是有差異的,比如膀胱的亮度最高,其次是腺體,然后是癌灶,背景部分的亮度最低,因此當(dāng)ADC圖像組分越多,灰度差異越大,組分越復(fù)雜,越可能發(fā)生侵犯。特別是針對(duì)子區(qū)域模型,特征來(lái)源清晰,解釋性較強(qiáng),在臨床上具有較好的接受程度。
雖然研究使用自動(dòng)化的方法生成注意力ROI,但是需要醫(yī)生手工對(duì)前列腺腺體和癌灶進(jìn)行勾畫,勾畫過(guò)程也是異常煩瑣。后續(xù)可以使用深度學(xué)習(xí)對(duì)腺體和癌灶進(jìn)行自動(dòng)的分割,使得過(guò)程自動(dòng)化。其次,本研究?jī)H僅使用了單一中心的數(shù)據(jù),不具有普適性,后續(xù)可以在更多不同設(shè)備不同中心的數(shù)據(jù)上進(jìn)行驗(yàn)證和優(yōu)化。
綜上所述,本研究提出了一種自動(dòng)生成注意力圖的方法,對(duì)注意力ROI進(jìn)行子區(qū)域劃分并提取特征進(jìn)行影像組學(xué)建模,以輔助診斷磁共振前列腺癌包膜侵犯的診斷問(wèn)題。本研究所提出的模型使用了解釋性較好的特征,有助于輔助臨床醫(yī)生進(jìn)行診斷,在臨床決策中具有一定的參考價(jià)值,注意力圖的思路也能夠?yàn)槠渌嚓P(guān)診斷問(wèn)題提供研究思路。
作者利益沖突聲明:全體作者均聲明無(wú)利益沖突。