張瀝 折霞 張鑫 湯敏 雷曉燕 閔智乾 李隴超 宦怡
前列腺癌(prostate cancer,PCa)是男性常見的惡性腫瘤[1]。臨床顯著 PCa(clinically significant PCa,CsPCa)是指Gleason評(píng)分≥7分、伴或不伴體積≥0.5 cm3、伴或不伴前列腺包膜外侵犯的PCa,此類腫瘤惡性程度高,侵襲性強(qiáng),需要積極治療[2-3]。臨床非顯 著 PCa(clinically insignificant PCa,CiPCa)是 指Gleason評(píng)分<7分的腫瘤,侵襲性較低,進(jìn)展緩慢,可采取隨訪觀察和主動(dòng)監(jiān)測的治療方式,而對(duì)其過度診斷和治療反而會(huì)增加病人的負(fù)擔(dān)、降低生存質(zhì)量[4-5],因此術(shù)前準(zhǔn)確鑒別CsPCa和CiPCa對(duì)于病人選擇合適的治療方案和評(píng)估預(yù)后具有十分重要的價(jià)值。影像組學(xué)可以反映整個(gè)瘤體信息,分析腫瘤異質(zhì)性,輔助腫瘤的鑒別診斷,但其在前列腺腫瘤臨床應(yīng)用方面的報(bào)道較少[6]。本研究探討基于機(jī)器學(xué)習(xí)的雙參數(shù)MRI(T2WI+ADC)影像組學(xué)模型對(duì)CsPCa和CiPCa的診斷價(jià)值,以期為兩者的鑒別診斷提供依據(jù)。
1.1 研究對(duì)象 回顧性收集陜西省人民醫(yī)院2014年10月—2019年10月經(jīng)病理證實(shí)為PCa的病人142 例,年齡 65~86 歲,平均(73.7±8.24)歲,其中CsPCa 101例,CiPCa 41例。前列腺特異性抗原(prostate specific antigen,PSA) 中 位 數(shù) 為 13.03(7.38~30.88)ng/mL,PSA 密度 (PSA density,PSAD)中位數(shù)為 0.19(0.12~0.31) ng/(mL·g)。 所有病人術(shù)前均進(jìn)行雙參數(shù)-MRI檢查。納入標(biāo)準(zhǔn):①經(jīng)穿刺或手術(shù)病理證實(shí)為PCa;②采用同一臺(tái)設(shè)備進(jìn)行T2WI和擴(kuò)散加權(quán)成像(DWI)檢查,且所有影像均于病人術(shù)前10 d內(nèi)獲?。虎塾跋袂逦?,無明顯偽影。排除標(biāo)準(zhǔn):術(shù)前進(jìn)行放療、化療、內(nèi)分泌等治療者。
1.2 設(shè)備與方法 采用荷蘭Philips 3.0 T Ingenia MR掃描設(shè)備,使用16通道相控陣腹部線圈。病人取仰臥位,掃描范圍從髂棘掃描到恥骨聯(lián)合下緣。掃描序列及參數(shù):①快速自旋回波(TSE)序列,T2WI:TR/TE=5 202 ms/100 ms,層厚 3 mm,層間距 0,視野 20 cm×20 cm,矩陣 260×260,激勵(lì)次數(shù) 1。 ②DWI序列:b 值取 0、1 000、2 000 s/mm2,由 b=1 000 s/mm2的圖像自動(dòng)后處理重建ADC圖。③動(dòng)態(tài)增強(qiáng)(DCE)采用快速梯度序列,TR/TE=3.6 ms/1.76 ms,經(jīng)肘前靜脈團(tuán)注對(duì)比劑(釓布醇或釓噴酸葡胺,濃度1.0 mol/L)0.1 mmol/kg體質(zhì)量,注射流率2~3 mL/s,連續(xù)掃描18個(gè)期相。
1.3 腫瘤影像三維分割 首先將T2WI和ADC圖數(shù)據(jù)經(jīng)GE醫(yī)療公司人工智能Analysis-Kinetics(A.K)軟件進(jìn)行影像預(yù)處理,隨后將所有預(yù)處理后的影像導(dǎo)入ITK-SNAP軟件(3.8版本)進(jìn)行病灶分割,由1名5年MRI診斷經(jīng)驗(yàn)的醫(yī)師手動(dòng)逐層勾畫三維體積興趣區(qū)(volume of interest,VOI)(圖 1),并由1名10年MRI診斷經(jīng)驗(yàn)的副主任醫(yī)師復(fù)閱。然后由1名工作8年的副主任醫(yī)師在2組病例中分別任意選取15例勾畫VOI,再由第1位醫(yī)師重復(fù)勾畫上述30例病例的VOI。
1.4 影像組學(xué)研究流程 ①數(shù)據(jù)預(yù)處理:采用A.K軟件對(duì)提取的影像組學(xué)特征數(shù)據(jù)進(jìn)行異常值處理,主要將異常值替換為所在列的中位數(shù)。通過隨機(jī)分層抽樣的方法將所有病例以7∶3的比例分為訓(xùn)練組及驗(yàn)證組。②影像組學(xué)特征提?。翰捎肁.K軟件對(duì)獲得的VOI進(jìn)行特征提取,分別自動(dòng)提取6大類共402個(gè)影像組學(xué)特征,包括一階統(tǒng)計(jì)特征直方圖和二階及高階統(tǒng)計(jì)特征(形態(tài)學(xué)矩陣、灰度共生矩陣參數(shù)、游程矩陣參數(shù)、灰度區(qū)域大小矩陣參數(shù)、Haralick矩陣特征),并對(duì)上述特征進(jìn)行歸一化處理。③影像組學(xué)特征降維:采用相關(guān)性分析和LASSO算法對(duì)上述特征進(jìn)行篩選。④機(jī)器學(xué)習(xí)建模:采用R-Tree和Logistic回歸分析算法對(duì)上述篩選的特征參數(shù)構(gòu)建模型。共構(gòu)建4組模型:1)ADC特征集;2)T2WI特征集;3)T2WI/ADC 的聯(lián)合特征集(先篩選再聯(lián)合);4)T2WI+ADC特征集 [2種序列聯(lián)合804個(gè)組學(xué)特征篩選獲得的最優(yōu)特征集(即先聯(lián)合再篩選)]。⑤驗(yàn)證:使用訓(xùn)練組數(shù)據(jù)建立模型,通過驗(yàn)證組進(jìn)行驗(yàn)證。影像組學(xué)研究流程見圖2。
1.5 統(tǒng)計(jì)學(xué)方法 采用SPSS 25.0統(tǒng)計(jì)軟件對(duì)數(shù)據(jù)進(jìn)行分析。符合正態(tài)分布的計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差()表示,2組間比較采用 t檢驗(yàn);非正態(tài)分布的計(jì)量資料以中位數(shù)(四分位間距)[M(P25,P75)]表示,2組間比較采用Mann-Whitney U檢驗(yàn)。計(jì)數(shù)資料以例表示,2組間比較采用χ2檢驗(yàn)。采用組內(nèi)相關(guān)系數(shù)(interclass correlation coefficient,ICC)分析 2 名醫(yī)師(組間)和第1位醫(yī)師前后2次(組內(nèi))勾畫VOI結(jié)果的一致性。ICC<0.4代表一致性差,0.4≤ICC<0.75表示一致性中等,ICC≥0.75表示一致性較高。采用受試者操作特征(ROC)曲線評(píng)估模型的診斷效能,并計(jì)算相應(yīng)曲線下面積(AUC)、準(zhǔn)確度、特異度、敏感度。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
圖2 影像組學(xué)研究流程圖。A圖,影像獲取與病灶提取。B圖,影像組學(xué)特征提取。C圖,影像組學(xué)特征選擇與鑒別診斷模型建立。
圖1 腫瘤影像分割。A圖,T2WI橫斷面影像。B圖,基于像素沿腫瘤邊界勾畫二維興趣區(qū)(ROI)。 C、D 圖,ROI融合后影像的三維 VOI。
2.1 2組病人一般資料及病灶分布比較 CsPCa組的 PSA 值高于CiPCa組 (P<0.05),CsPCa組同時(shí)累及外周帶和移行帶的病灶數(shù)多于CiPCa組(P<0.05)。2組病人年齡、PSAD及其他部位分布的差異均無統(tǒng)計(jì)學(xué)意義(均P>0.05)。詳見表1。
2.2 一致性分析 2名醫(yī)師T2WI上勾畫VOI的平均值分別為(1.5±0.78) cm3和(1.4±0.63) cm3,ADC 圖上勾畫 VOI的平均值分別為(1.4±0.88) cm3和(1.37±0.92)cm3,T2WI、ADC 圖上 2 名醫(yī)師勾畫 VOI一致性檢驗(yàn)的 ICC(95%CI)值分別為 0.963(0.925~0.982)和 0.919(0.836~0.960)。同一名醫(yī)師在 T2WI和 ADC圖上第2次勾畫VOI的平均值為(1.5±0.39)cm3和(1.42±0.74)cm3。 T2WI、ADC 圖上同一名醫(yī)師前后 2次勾畫VOI一致性檢驗(yàn)的ICC(95%CI)值分別為0.977(0.925~0.989)和 0.925(0.845~0.963)。
2.3 影像組學(xué)診斷模型的診斷效能 驗(yàn)證組中應(yīng)用Logistic回歸算法4種模型中ADC模型的AUC最高,其次為T2WI+ADC、T2WI模型,T2WI/ADC模型的AUC最低;ADC模型和T2WI模型的敏感度較高,其中T2WI模型的敏感度最高,但2種模型的特異度相對(duì)不高,T2WI+ADC模型的特異度最高,T2WI/ADC模型的特異度最低。應(yīng)用Logistic回歸算法,4種模型的AUC均高于R-Tree算法。2種機(jī)器學(xué)習(xí)算法的ADC模型的準(zhǔn)確度以及T2WI/ADC、T2WI+ADC模型的特異度均相等 (表2)。驗(yàn)證組中基于Logistic回歸算法的4種模型的ROC曲線見圖3。
前列腺M(fèi)RI和PSA檢查目前已成為篩查PCa較為常用的手段,但常規(guī)檢查方法難以鑒別CsPCa和CiPCa,導(dǎo)致臨床過度穿刺活檢。其次,由于傳統(tǒng)閱片主觀性較強(qiáng),不同經(jīng)驗(yàn)的醫(yī)師對(duì)影像特征的把握具有一定的差異,影響疾病的診斷準(zhǔn)確率。影像組學(xué)模型能定量反映CsPCa和CiPCa的病理學(xué)特征,而且不受主觀經(jīng)驗(yàn)的影響。目前基于MRI影像組學(xué)模型區(qū)分CsPCa和CiPCa的診斷價(jià)值國內(nèi)未見相關(guān)報(bào)道,因此本研究對(duì)此內(nèi)容進(jìn)行初步探討。
本研究發(fā)現(xiàn),CsPCa組的 PSA值高于CiPCa組,CsPCa組病灶位于混合區(qū)的病灶數(shù)多于CiPCa組。這提示臨床上對(duì)于高水平PSA的人群有必要進(jìn)行MRI檢查進(jìn)一步明確診斷,而對(duì)于病灶范圍同時(shí)累及外周帶和移形帶的混合區(qū)病灶應(yīng)高度懷疑CsPCa。
2名醫(yī)師雖然工作經(jīng)驗(yàn)不同,但手工勾畫VOI的影像組學(xué)特征結(jié)果一致性較高(ICC均>0.91),表明影像組學(xué)分析受主觀經(jīng)驗(yàn)干擾少,具有很好的可重復(fù)性。
表2 驗(yàn)證組中4種模型的2種機(jī)器學(xué)習(xí)算法的診斷效能
表1 2組病人一般資料及病灶分布比較
圖3 應(yīng)用Logistic回歸算法4種驗(yàn)證模型的ROC曲線。ADC、T2WI、ADC/T2WI、ADC+T2WI模型的 AUC 分別為 0.908、0.864、0.762、0.868。
本研究基于MRI影像組學(xué)標(biāo)簽對(duì)CsPCa和CiPCa的鑒別進(jìn)行了預(yù)測分析,結(jié)果顯示,影像組學(xué)特征能有效地鑒別診斷CsPCa和CiPCa。分析原因可能是不同Gleason分級(jí)的PCa在細(xì)胞內(nèi)部成分、液體含量、膠原蛋白水平和纖維肌肉基質(zhì)等方面表現(xiàn)均有差異。CsPCa細(xì)胞密集,導(dǎo)致細(xì)胞外間隙減少,而CiPCa仍存留一些腺體結(jié)構(gòu),細(xì)胞外液存在空間,這些差異可通過影像組學(xué)模型定量反映其病理學(xué)特征[7-8]。
本研究采用了相關(guān)性分析和LASSO 2種方法來篩選特征,從而確保特征選擇的穩(wěn)定性和可重復(fù)性,保證所選特征對(duì)于分類器的有效價(jià)值[9]。基于ADC和T2WI的單序列模型的AUC值均較高,該結(jié)果表明在某些病人中鑒別CsPCa和CiPCa時(shí),并不需要更多更復(fù)雜的序列,這將有助于簡化掃描方案[10]。此外,對(duì)于放射科醫(yī)生而言,T2WI和DWI/ADC序列在PCa的診斷中具有重要作用,也是研究者們在影像組學(xué)研究中最常應(yīng)用的序列。而且,使用過多序列會(huì)因?yàn)閳D像分割耗時(shí)、費(fèi)力而影響其在臨床中的應(yīng)用。因此,選擇最有價(jià)值的序列更為重要。T2WI+ADC 2種序列聯(lián)合804個(gè)組學(xué)特征篩選獲得的特征集AUC值高于先篩選再聯(lián)合的T2WI/ADC特征集,這可能與不同序列之間特征相互作用有關(guān)。
機(jī)器學(xué)習(xí)R-Tree和Logistic回歸算法均可用于構(gòu)建預(yù)測模型,選擇適當(dāng)?shù)乃惴商岣吣P偷姆€(wěn)定性和預(yù)測效能。本研究結(jié)果顯示應(yīng)用Logistic回歸算法4種模型的AUC均高于R-Tree算法,可能是由于Logistic算法是線性模型,在相同條件下線性模型的穩(wěn)定性要優(yōu)于非線性模型。一般認(rèn)為上述2種算法均比較適合小樣本和二分類變量的模型構(gòu)建,但本小樣本研究結(jié)果更推薦使用Logistic回歸算法。同時(shí),Logistic回歸算法也是目前最常用的算法,而且易于操作。
為尋找CsPCa和CiPCa的最佳鑒別特征,Kesch 等[11]通過提取多參數(shù)(包括 T2WI、ADC、DCE序列)MRI和PET/CT的315個(gè)紋理特征,結(jié)果顯示較低的平均ADC值與腫瘤侵襲性增加有明顯的關(guān)聯(lián),因此影像組學(xué)模型在未來可能有助于更好地區(qū)分惰性和侵襲性PCa;但該研究未對(duì)模型進(jìn)行驗(yàn)證,而且只包括了紋理特征。本研究除了分析紋理特征,還分析了其他高階特征,并將病人分為訓(xùn)練組和驗(yàn)證組,提高了該模型在臨床中的泛化能力。
Min等[12]研究顯示,基于多參數(shù)MRI的影像組學(xué)特征可無創(chuàng)地區(qū)分CsPCa和CiPCa,表明多參數(shù)MRI影像組學(xué)特征對(duì)病理分級(jí)具有良好的價(jià)值;但是該研究使用多參數(shù)序列中的DCE為多期相,而且研究只分析了多參數(shù)聯(lián)合診斷結(jié)果,沒有對(duì)單一序列影像組學(xué)進(jìn)行分析比較,研究存在一定的局限性。也有研究者[13-14]報(bào)道,在進(jìn)行病灶分割時(shí),DCE序列期相選擇難以統(tǒng)一,且圖像分割費(fèi)時(shí)費(fèi)力。
還有研究者[15]基于T2WI序列的影像組學(xué)機(jī)器學(xué)習(xí)模型的方法構(gòu)建了PCa有無包膜侵犯的預(yù)測模型,結(jié)果表明該模型具有較好的臨床實(shí)用性。與影像診斷醫(yī)生的目測評(píng)估相比,影像組學(xué)診斷價(jià)值更高。該模型有助于影像診斷醫(yī)生報(bào)告腫瘤是否存在包膜外擴(kuò)展,以及促進(jìn)PCa管理的臨床決策。但是該研究僅使用了單序列分析,且僅針對(duì)包膜侵犯病例進(jìn)行預(yù)測,未能有效地鑒別CsPCa和CiPCa。
本研究尚存在以下局限性:①本研究為單中心回顧性研究,將來需要行前瞻性研究并進(jìn)行外部驗(yàn)證。②本研究盡管使用了三維VOI,且組內(nèi)及組間一致性均較高,但不排除手動(dòng)勾畫VOI時(shí)主觀因素引起的偏差[16]。③部分病理為穿刺活檢結(jié)果,今后的研究應(yīng)盡量基于病理組織切片,細(xì)化病理分級(jí),建立不同分級(jí)的預(yù)測模型。④由于本研究未將影像組學(xué)特征與臨床特征聯(lián)合建模,還需要擴(kuò)大樣本量進(jìn)一步研究。
綜上所述,本研究使用機(jī)器學(xué)習(xí)算法常用的R-Tree和Logistic回歸構(gòu)建預(yù)測模型,研究結(jié)果表明基于T2WI和ADC影像的影像組學(xué)模型能夠穩(wěn)定、有效且無創(chuàng)地鑒別診斷CsPCa和CiPCa,應(yīng)用Logistic回歸算法效果更佳。