龔涵穎 陸鈺 湯文瑞 韓俊 朱翔*
前列腺癌是男性常見惡性腫瘤之一[1],隨著發(fā)病率逐年上升,嚴重威脅老年男性的生活質(zhì)量與生命安全。血清前列腺特異抗原(prostate specific antigen,PSA)是早期前列腺癌的主要腫瘤篩查標記物[2],但血清PSA的靈敏度及特異度均不高,也可能由前列腺增生、炎癥、直腸指檢等引起。經(jīng)直腸超聲引導下的前列腺活檢是目前常用的前列腺癌確診方法,但由于取樣錯誤、觀察者水平的差異等原因,活檢可能不能反映真實等級,且病理活檢作為一項有創(chuàng)性檢查,存在出血、感染等風險[3]。多參數(shù)磁共振(multiparametric magnetic resonance imaging,mp-MRI)可以提供前列腺腫瘤的定位與分期,在前列腺癌診斷方面起重要作用[4],但受診斷醫(yī)師的水平及經(jīng)驗差異影響,對前列腺腫瘤mp-MRI圖像的判斷仍存在主觀性。因此需要一項更加客觀、準確且無創(chuàng)的輔助檢查來提高前列腺癌的術(shù)前評估效率。本研究擬通過提取雙參數(shù)磁共振(biparameter magnetic resonance imaging,bp-MRI)的圖像特征構(gòu)建機器學習模型,探討影像組學在預測中低風險與高風險前列腺癌的作用。
1.1 臨床資料 回顧性分析2021年1月至12月本院經(jīng)病理證實為前列腺癌的患者,并獲得患者的Gleason 評分(Gleason Score,GS)、臨床分期及血清PSA 值,根據(jù)美國國家綜合癌癥網(wǎng)絡(luò)(national comprehensive cancer network,NCCN)前列腺癌分級指南將患者分為中低危組及高危組[5]。中低危組:PSA<20 ng/mL 且GS ≤7 且臨床分期T1~T2c,高危組:PSA ≥20 ng/mL 或GS>7 或臨床分期T3a~T4。納入標準:①MRI 檢查后2 個月內(nèi)獲得前列腺癌的病理結(jié)果;②患者血清PSA 異常升高;③所有納入病例無MRI 檢查禁忌癥。排除標準:①MRI圖像不完整或圖像質(zhì)量差;②患者入院前曾接受穿刺活檢或化療;③臨床資料不完整;④合并其他惡性腫瘤者。本項研究從符合上述入組標準的前列腺癌患者中,篩選經(jīng)同一臺機器成像的患者119 例,其中中低危位組57 例,高危組62 例。
1.2 檢查方法 應(yīng)用美國GE Healthcare Discovery 750 3.0T 的MR 成像系統(tǒng),采用盆腔相控陣線圈?;颊呷⊙雠P位,覆蓋整個前列腺與精囊,盡量減少影像偽影。橫斷位T2WI 序列,TR:3,343.0 ms,TE:Minimum ms,層厚3.0 mm,層間距1.0 mm,F(xiàn)OV 34 cm×34 cm,矩陣320×256,激勵次數(shù)(NEX)=2。橫軸面DWI 掃描在定位時需要保證和T2WI 所有序列層面一致,TR:2,080 ms,TE:Minimum ms,層厚3.0 mm,層間距1.0 mm,F(xiàn)OV34 cm×34 cm,矩陣128×128,激勵次數(shù)(NEX)2~8 不等,b值=1,000 s/mm2。ADC 圖由DWI 圖生成。1.3 感興趣區(qū)勾畫 收集患者完整的 T2WI 及ADC 圖像,從本院影像歸檔與通信系統(tǒng)(picture archiving and communication system,PACS)系統(tǒng)中以dicom 格式導出所有圖像,并轉(zhuǎn)換為占據(jù)空間更小nii 格式文件再進行后續(xù)處理。由兩位>10 年MRI 診斷經(jīng)驗的影像科醫(yī)師根據(jù)已獲得的每一針標本的組織病理學GS 使用視覺配準法,在T2WI 和ADC 圖像上確定相應(yīng)的病變位置在ITK-SNAP 操作界面逐一手動對每個層面橫軸位T2WI 及ADC 圖像的病灶所在區(qū)域進行感興趣區(qū)(region of interest,ROI)勾畫,生成三維興趣容積(volum of interest,VOI)。有疑問時由2 位醫(yī)師共同商討決定。為減小ROI 的部分容積效應(yīng),勾畫時保持繪制線距前列腺邊緣大約1~2 mm 距離(見圖1)。
1.4 圖像特征提取與篩選 圖像特征提取與篩選是影像組學的重要環(huán)節(jié),本研究使用Pyradiomics 工具包對醫(yī)師勾畫的VOI 分別進行高通量的特征提取,并使用目前常用的Z-score 方法對提取的特征進行歸一化,將特征值拉伸到(0,1)之間,以便進一步處理。本研究先采用Spearmen 相關(guān)系數(shù)法剔除過度相似的特征,在相關(guān)系數(shù)>0.9 的兩組特征中保留其中一組。再使用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)基于最小懲罰系數(shù)(λ)進行特征降維。
圖1 腫瘤分割示意圖。A. ADC序列橫斷面圖像;B. 沿腫瘤邊界勾畫感興趣區(qū)(ROI);C、D. ROI融合后形成三維興趣容積(VOI)
1.5 模型構(gòu)建與評估 通過不斷訓練和調(diào)整分類器,最終得到能夠比較準確分類的模型。使用篩選后的重要特征,從中低危組與高危組患者中分別隨機抽取70%作為訓練組(n=83),剩余30%作為驗證組(n=36)。分類器的訓練采用十折交叉驗證法,將訓練組隨機分成十組進行,最后分別建立基于T2WI、ADC、T2WI+ADC的三組支持向量機(support vector machine,SVM)模型及隨機森林(random forest,RF)模型。用測試組對模型進行驗證,檢驗每一種模型的準確率、特異性、敏感性并繪制受試者操作特征曲線(ROC),得到ROC 曲線下面積(AUC),使用AUC 評價每一分類器的性能。
經(jīng)Pyradiomics 共提取出107 個特征,包括形態(tài)學特征14 個、一階統(tǒng)計特征18 個、紋理統(tǒng)計特征75 個?;赥2WI 序列提取的特征經(jīng)Spearman 相關(guān)系數(shù)法篩選出27 個特征,在LASSO 回歸對應(yīng)logλ=0.039 時特征數(shù)為10 個;基于ADC 序列提取的特征經(jīng)spearman相關(guān)系數(shù)法篩選出32 個特征,在LASSO 回歸對應(yīng)logλ=0.052 時特征數(shù)為5 個;T2WI+ADC 序列提取的特征經(jīng)Spearman 相關(guān)系數(shù)法篩選出15 個特征,在LASSO回歸對應(yīng)logλ=0.013 時特征數(shù)為10 個(見圖2~3)。基于T2WI 序列建立SVM 模型、RF 模型的AUC 分別為0.797、0.713;基于ADC 序列建立SVM 模型、RF 模型的AUC 分別為0.826、0.667;T2WI+ADC 序列建立SVM模型、RF 模型的AUC 分別0.871、0.724(見表1、圖4)。聯(lián)合雙參數(shù)的模型預測效能優(yōu)于單參數(shù)模型。
圖2 三組數(shù)據(jù)集LASSO回歸基于λ特征篩選
圖3 三組數(shù)據(jù)集篩選后特征加權(quán)
圖4 基于T2WI、ADC及T2WI+ADC構(gòu)建SVM模型、RF模型的ROC曲線
表1 3組模型對前列腺癌風險分級的預測效能
眾多研究表明,中低危的早期前列腺癌侵襲性低且進展緩慢,可采取隨訪觀察或主動監(jiān)測的治療方式,立即實施不合理的治療反而會增加患者負擔[6]。既往臨床結(jié)果顯示,中低?;颊卟扇∏傲邢侔└吻谐g(shù)的術(shù)后并發(fā)癥少且復發(fā)率低,能達到較好的療效[7]。而高危前列腺癌侵襲性強,術(shù)后復發(fā)率高,且高危前列腺癌存在包膜浸潤、周圍侵犯、遠處轉(zhuǎn)移等情況,在發(fā)現(xiàn)時常錯過手術(shù)的最佳時機,主張采取內(nèi)分泌治療或放療等姑息性治療。因此,科學了解前列腺癌的生物特性對患者治療方案的選擇至關(guān)重要。NCCN 指南根據(jù)血清PSA值、病理結(jié)果、臨床分期將前列腺癌進行風險分級,分成低危組、中危組、高危組,并再進一步細分成六組。相比較于僅依靠單項數(shù)據(jù)的傳統(tǒng)評估前列腺癌的方式,該風險分級方法提供了更加全面、科學、細致風險分級系統(tǒng),為不同患者的個體化治療提供依據(jù)。
Mp-MRI 被認為是目前無創(chuàng)檢測和定位前列腺癌的最有效方法。bp-MRI(T2WI 和ADC)檢測前列腺腫瘤的準確度與傳統(tǒng)的mp-MRI 相當[8]。多項研究基于T2WI 和(或)ADC 序列構(gòu)建影像組學模型用于前列腺癌的定性診斷、危險度評估、療效評價等。T2WI 圖像可提供前列腺與周圍結(jié)構(gòu)的高分辨率圖像,顯示前列腺的解剖分區(qū)及病變的準確定位。SUN 等[9]用T2WI 紋理分析預測區(qū)分GS ≥4+3 分與GS ≤3+4 分的前列腺癌,結(jié)果表明GLCM 紋理特征與腫瘤病理風險等級分層有明顯關(guān)聯(lián)。HECTORS 等[10]研究發(fā)現(xiàn)基于T2WI 序列構(gòu)建的分類器在PI-RADS 3 病變中對臨床前列腺癌預測表現(xiàn)出良好性能。還有學者基于T2WI 構(gòu)建模型預測前列腺癌有無包膜侵犯,結(jié)果表明該模型有較好的臨床實用性[11]。本研究基于T2WI 序列構(gòu)建的SVM 模型及RF 模型在預測前列腺癌風險分級也表現(xiàn)出良好效能,AUC 分別為0.797、0.713。ADC 通過定量觀測組織內(nèi)水分子的運動情況反映腫瘤的惡性程度,高危前列腺癌組織致密,細胞間隙小,水分子的運動受到強烈抑制而表現(xiàn)為低信號,影像組學可以定量反映中低危與高危前列腺癌間的圖像差異。WIBMER 等[12]研究MRI的Haralick 紋理發(fā)現(xiàn)GS ≤3 + 4 分癌與 GS ≥ 4 + 3 分癌的熵有顯著性差異,并揭示ADC 圖像能量與GS 分期有關(guān)。GONG 等[13]基于ADC 序列構(gòu)建的LR 模型預測GS>7 前列腺癌AUC 達0.787,與聯(lián)合雙參數(shù)的模型效能相當。本研究通過提取ADC 序列特征構(gòu)建的SVM模型AUC 為0.826,表現(xiàn)出良好的前列腺癌風險分級預測潛力。然而關(guān)于T2WI 與ADC 哪一序列構(gòu)建的分類器模型預測前列腺癌風險更佳仍尚無定論,大部分學者認為ADC 序列更能反映腫瘤的惡性程度,然而本研究結(jié)果顯示基于T2WI 序列的RF 模型效能并不亞于ADC 模型,這可能與模型的選擇有關(guān)。
本研究中聯(lián)合雙參數(shù)序列的機器學習模型AUC普遍高于單一序列的模型,SVM 模型訓練集AUC 為0.871,RF 模型訓練集AUC 為0.724。這可能是由于雙參數(shù)圖像整合單序列的優(yōu)勢,保留更多有價值的特征信息,提高模型預測前列腺癌風險分級的效能,具有較好的臨床應(yīng)用潛能,與ZHANG 等[14]研究結(jié)果一致。LI等[15]研究提取152 例前列腺癌T2WI+ADC 圖像特征建立的模型能夠準確、自動區(qū)分CG 中的低級別和高級別前列腺癌。謝金珂等[16]對92 例前列腺癌患者的T2WI、ADC 圖像進行紋理分析后用于區(qū)分低級別和高級別前列腺癌的AUC 達0.714。然而部分學者認為在鑒別高危和低危前列腺癌時,單序列模型的效能雖略低于多序列模型,但其兼顧簡化掃描、易于分割、容易質(zhì)控、節(jié)約耗時的優(yōu)點,更利于影像組學發(fā)展與推廣[17]。
SVM 算法與RF 算法均比較適合小樣本和二分類變量的模型構(gòu)建,也是目前傳統(tǒng)影像組學研究中的常用算法。SVM 模型作為一類廣義的線性分類器,常用于解決高維空間的小樣本下機器學習問題,且擁有比較強的泛化能力,但傳統(tǒng)的SVM 算法有只能處理二類分類問題的弊端;RF 模型中包含多個決策樹,能處理高維數(shù)據(jù)問題,其優(yōu)勢包括簡單、易實現(xiàn)、計算開銷小等,但在某些噪音較大的分類或回歸問題上會出現(xiàn)過擬合的情況。本研究中SVM 模型在三種數(shù)據(jù)集中的AUC 均高于RF 模型,達到優(yōu)秀級別的性能,可能與本研究樣本數(shù)量以及數(shù)據(jù)分布有關(guān)。
綜上所述,T2WI、ADC 序列模型均有良好的分類效能,聯(lián)合雙參數(shù)序列的模型在前列腺癌風險分級的分類中優(yōu)于單序列,并且SVM 模型的效能普遍優(yōu)于RF模型。影像組學模型能無創(chuàng)進行前列腺癌術(shù)前預測并指導個體化治療方案選擇,具有很大的臨床應(yīng)用潛力。