馮玉潔,吳隘紅,付啟歡,洪睿霞,周航,李芳
(重慶大學附屬腫瘤醫(yī)院超聲醫(yī)學科,重慶 400030)
前列腺癌(Prostate cancer,PCa)是男性最常見的惡性腫瘤之一,2020 年全球新發(fā)病例數(shù)141萬,在全球男性新發(fā)惡性腫瘤中排名第二,死亡人數(shù)38萬,在全球男性惡性腫瘤死亡人數(shù)中排名第二[1]。目前PCa 的處理方式包括等待觀察、積極隨訪、根治性手術治療、外放射治療、內分泌治療、冷凍治療、放射性粒子植入、高強度聚焦超聲、射頻消融等。美國國立綜合癌癥網(wǎng)絡(National Comprehensive Cancer Network,NCCN)PCa 診療指南中對于高、中、低危PCa 的治療有明確不同的方案推薦,PCa 危險度的分類可以指導臨床治療[2]。因此,對于PCa 危險度預測就顯得非常重要。
研究表明經(jīng)直腸超聲(Transrectal ultrasound,TRUS)圖像特征、前列腺特異性抗原(Prostate specific antigen,PSA)濃度等與PCa 危險度相關,可以為建立PCa 危險度預測模型提供參數(shù)[3]。TRUS 的圖像特征多而復雜,僅通過醫(yī)生的經(jīng)驗來預測PCa 的危險度是困難的。近年來,人工智能在醫(yī)學領域得到廣泛應用,機器學習方法可以從海量醫(yī)學數(shù)據(jù)中提取信息。以往研究表明機器學習在疾病診斷、預測、危險度分層等方面具有重要的研究意義和實用價值[4]。因此,本研究擬利用機器學習方法,建立基于超聲圖像特征的PCa 危險度預測模型,期望為PCa 患者治療方式的選擇提供依據(jù)。
回顧性分析重慶大學附屬腫瘤醫(yī)院2017 年1月—2020 年9 月的PCa 患者198例,年齡47~93歲,平均(72.3±7.0)歲。前列腺體積6.9~188.0mL,平均(55.4±32.6)mL??偳傲邢偬禺惪乖═otal prostate specific antigen,tPSA)0.033~7204 μg/L,平均(426.4±1085.7)μg/L。納入標準:①患者穿刺術前均行TRUS 檢查;②穿刺標本經(jīng)組織病理學診斷證實為PCa 并進行Gleason 評分。排除標準:①患者在行經(jīng)直腸前列腺超聲檢查前接受過治療,如內分泌治療、放療等;②檢查后患者有效圖像缺失或質量不佳,影響分析;③資料不全的患者。本研究為回顧性分析,無需醫(yī)院倫理委員會批準。
1.2.1 穿刺活檢
患者穿刺前停止使用抗凝藥物1 周及以上,行血、尿常規(guī)檢查,排除凝血功能障礙、血尿和尿路感染。采用東芝Aplio500 超聲診斷儀,腔內雙平面探頭5.0~10.0 MHz。采用Bard 自動活檢槍(美國巴德公司),18G 穿刺針,經(jīng)會陰部穿刺,行12 針系統(tǒng)穿刺法,前列腺兩側外周帶尖、體、底部各2針,如有可疑病灶區(qū)額外加1~3 針。
1.2.2 TRUS 檢查及圖像分析
TRUS 檢查包含兩部分,即TRUS 二維顯像和彩色多普勒血流顯像(CDFI)。采用東芝Aplio 系列超聲診斷儀,直腸腔內探頭,探頭頻率為5.0~10.0 MHz;囑患者左側臥位,充分暴露臀部,行常規(guī)TRUS 前列腺檢查,測量大小,觀察二維特征,并保留清晰圖片;采用CDFI 觀察血流特征,并保留清晰圖片。兩種超聲圖片共保留5 146幅,觀察PCa 患者的TRUS 圖像特征,包括前列腺兩側葉對稱性、包膜完整性、內外腺分界清晰度、前列腺外腺腺體回聲均勻程度、外腺腺體血流信號對稱性、外腺腺體血流量情況、有前列腺結節(jié)灶者觀察結節(jié)回聲、結節(jié)大小、結節(jié)邊界、結節(jié)形態(tài)、結節(jié)位置、分布方式、分布范圍、結節(jié)灶血流分布、結節(jié)灶血流量情況等,共15 個超聲圖像特征(圖1,2)。
1.3.1 結節(jié)灶血流量情況
參考文獻[5],采用Adler 半定量分級。0 級:結節(jié)灶未見明顯血流信號;Ⅰ級:為少量血流,可見1~2 個點狀或細棒狀腫瘤血管,棒狀血流不超過病灶直徑的1/2;Ⅱ級:為中量血流,可見3~4 個點狀血流或一個較長的血管穿入病灶,其長度可接近或超過腫塊半徑;Ⅲ級:為多量血流可見≥5 個點狀血流或2 個較長血管。
1.3.2 外腺腺體血流量情況
除結節(jié)灶外,外腺腺體血流超過腺體1/3 為豐富;未超過1/3 為不豐富。
參考文獻[6]的標準,將PCa 分為低危、中危及高危。低危PCa:滿足PSA<10 μg/L、穿刺病理Gleason 評分小于7 分或臨床分期T1c~T2a 之一。中危PCa:滿足PSA 10~20 μg/L、穿刺病理Gleason 評分等于7 分或臨床分期T2b~T2c 之一。高危PCa:滿足PSA>20 μg/L、穿刺病理Gleason 評分大于7 分或臨床分期≥T3a 之一。
1.5.1 數(shù)據(jù)預處理
采用Weka 3.8 軟件將所有預測變量轉為數(shù)值型變量及標稱型變量,將缺失值定義為未知變量(圖3),根據(jù)PCa 危險度判定標準定義結局變量,用于建立模型。
1.5.2 構建樣本集
按照機器學習標準,采用十折交叉驗證方法(10-fold cross-validation)建立模型。十折交叉驗證是每次將數(shù)據(jù)隨機分成10份,其中9 份作為訓練集,將余下的1 份作為驗證集。該過程重復進行10次,可以有效防止“過擬合”現(xiàn)象提高模型的穩(wěn)定性和泛化能力[7]。
1.5.3 建模與實驗
1.5.3.1 分類預測模型
輸入變量包括年齡、tPSA 濃度、游離PSA 濃度(Free prostate specific antigen,fPSA),游離PSA百分比(fPSA/tPSA)、前列腺體積、PSA 密度(Prostate specific antigen density,PSAD)及15 個TRUS 超聲圖像特征,共21 個特征變量。本研究采用相關屬性值(Correlation attribute eval,CAE)通過測量屬性與類之間的相關性來評估屬性的價值。將每個值視為指標,在逐個值的基礎上考慮名義屬性,通過加權平均得到標稱屬性的整體相關性,進行單一特征相關性分析。采用決策樹(Decision tree,DT)、K 近鄰(knearest neighbour,KNN)、貝葉斯網(wǎng)絡、logistic 回歸及支持向量機(Support vector machine,SVM)分類器分別對PCa 建立預測模型,分析5 種學習模型預測PCa 危險度的準確率。
1.5.3.2 模型驗證
本研究對5 種分類預測模型使用的評價標準是機器學習普遍使用的性能評價指標。包括了精確度、敏感度、特異度、查準率、召回率、F1 值、接受者操作特性(Receiver operating characteristic,ROC)曲線及曲線下面積(Area under curve,AUC)。為了綜合考慮,本研究使用查準率和召回率的調和均值F1 值作為模型對比的最終評價指標。
采用MedCalc 18.10 軟件,利用z 檢驗對比五種機器學習方法的ROC 曲線及AUC,P<0.05 為差異有統(tǒng)計學意義。
基于CAE 分析數(shù)據(jù)集變量信息的相關性,根據(jù)單一特征屬性和類別的相關性排序并選擇特征。單一特征相關性由高到低依次是:前列腺內外腺分界(63.44%)、前列腺包膜完整度(52.51%)、前列腺對稱性(51.49%)、外腺腺體血流量情況(50.44%)、外腺腺體回聲均勻度(45.57%)、外腺腺體血流信號對稱性(37.91%)、tPSA(18.19%)、PSAD(16.02%)、結節(jié)灶血流量情況(15.32%)、結節(jié)灶長徑(15.22%)、fPSA(14.51%)、結節(jié)灶分布范圍(10.68%)、年齡(10.18%)、結節(jié)灶分布方式(9.49%)、結節(jié)灶形態(tài)(8.03%)、前列腺體積(7.36%)、結節(jié)灶血流分布(6.04%)、結節(jié)灶位置(4.47%)、fPSA/tPSA(3.04%)、結節(jié)灶邊界(3.02%)、結節(jié)灶回聲(1.98%)。最高的是內外腺分界是否清晰,相關度為63.44%,最低的是結節(jié)灶回聲,相關度為1.98%;相關度超過50%的有前列腺包膜完整度、前列腺對稱性、前列腺外腺腺體血流量情況。
對比DT、KNN、貝葉斯網(wǎng)絡、SVM、Logistic 回歸5 種機器學習模型訓練預測后的評價指標:準確率、靈敏度、特異度、查準率、召回率、F1 值、AUC(表1),以評價PCa 危險度的預測模型。結果顯示,F(xiàn)1 值最高的為貝葉斯網(wǎng)絡模型,其次依序為SVM、DT、KNN,Logistic 回歸模型最小。
表1 5 種機器學習模型預測前列腺癌危險度結果
5 種學習模型AUC 如圖4 所示。AUC 比較結果為:貝葉斯網(wǎng)絡>KNN>DT>SVM>logistic 回歸。KNN與貝葉斯網(wǎng)絡AUC 差異無統(tǒng)計學意義,P=0.5029;與DT、SVM、logistic回歸差異 有統(tǒng)計學意義,P<0.05。AUC對模型評價分以下幾類:0.51~0.60 為不及格,0.61~0.70 為差,0.71~0.80 為一般,0.81~0.90為好,0.91~1.00 為優(yōu)。logistic 回歸為一般,SVM 和DT 為好,貝葉斯網(wǎng)絡與KNN 為優(yōu)。
兩種評價方式均為貝葉斯網(wǎng)絡模型分類效果最佳,Logistic 回歸模型分類效果最差。
PSA 篩查有效提高了PCa 的診斷率,MRI 在預測PCa 危險度方面也具有較大臨床價值[8]。但TRUS是臨床中更常用的一種前列腺檢查方法,具有費用低、可重復性強、方便等優(yōu)點,且分辨率較高,可以清晰顯示腺體內部細微結構特征,可以用來預測PCa的危險度[9]。
本研究中采用相關屬性值分析單一參數(shù)與PCa危險度的相關性,分析的參數(shù)有患者年齡、PSA 以及經(jīng)直腸前列腺超聲影像特征,包括前列腺兩側葉對稱性、包膜完整性、內外腺分界清晰度、前列腺外腺腺體回聲均勻程度及血流分布情況、有無前列腺結節(jié),有前列腺結節(jié)者觀察結節(jié)回聲、結節(jié)大小、結節(jié)邊界及結節(jié)血流情況等,共15 個超聲圖像特征,相關性最高的為內外腺分界是否清晰,相關度也僅為63.44%,未超過75%,屬于弱相關,說明單一參數(shù)判斷PCa 危險度是非常困難的,需要多特征共同判斷。
由于與PCa 危險度相關的TRUS 圖像特征多且復雜,人腦直接分析比較困難。人工智能方法可以根據(jù)特征與疾病之間的統(tǒng)計規(guī)律以數(shù)據(jù)驅動的方式建立模型并預測疾病發(fā)生的概率,從而將已有的知識結構重組使之不斷提升自我的性能以達到PCa 危險度預測的目的[10-11]。機器學習方法是人工智能重要的研究領域,目前已被廣泛應用于醫(yī)學圖像處理,如CT、MRI、超聲等[12-13]。
以往有基于多參數(shù)前列腺MRI 機器學習模型預測高級別PCa 的研究[14-15],得到了比較好的預測效果(AUC 0.869~0.977)。然而MRI 檢查時間長,部分患者會有檢查禁忌。TRUS 因其簡便、禁忌癥少、分辨率高等優(yōu)點,是前列腺檢查更常用、應用更廣的影像學檢查方法。利用傳統(tǒng)統(tǒng)計學方法分析TRUS圖像特征與PCa 危險度的關系,由于TRUS 圖像特征多且復雜,與PCa 危險度的關系有交叉性,傳統(tǒng)分析方法難以達到預測的目的[3]。文獻[16] 基于TRUS 圖像特征貝葉斯網(wǎng)絡模型預測PCa 的發(fā)生,準確性為85.11%,但是沒有對PCa 的危險度進行預測。本研究的創(chuàng)新之處是采用TRUS 圖像特征,聯(lián)合年齡、tPSA、fPSA、游離PSA 百分比、前列腺體積及PSA 密度等多種臨床指標,運用貝葉斯網(wǎng)絡模型、KNN、DT、SVM 和Logistic 回歸機器學習模型預測PCa 危險度。貝葉斯網(wǎng)絡模型能夠比較好的反映數(shù)據(jù)的統(tǒng)計分布,且不依賴于數(shù)據(jù)分布的假設。本研究中貝葉斯網(wǎng)絡模型的AUC 最大,與KNN 差異無統(tǒng)計學意義,模型被評為優(yōu),而與DT、SVM 和Logistic回歸的AUC 差異均有統(tǒng)計學意義,DT、SVM 被評為好,Logistic 回歸被評為一般,結合F1 值貝葉斯網(wǎng)絡模型為最優(yōu)PCa 危險度預測模型。
本研究的局限性在于:本研究為單中心、小樣本量數(shù)據(jù),且為回顧性分析,可能存在選擇性偏倚;數(shù)據(jù)樣本存在不平衡的問題,如高?;颊弑壤^高。今后將進一步擴大樣本量、進行多中心研究以解決這些問題。
綜上所述,基于超聲圖像特征的貝葉斯網(wǎng)絡模型預測PCa 危險度的分類性能最優(yōu),可以為PCa 患者治療方式的選擇提供依據(jù)。