柏 冬,王 浩,李 璐,王宏林
1航天中心醫(yī)院(北京大學(xué)航天臨床醫(yī)學(xué)院)放射科,北京 100049;232081部隊(duì),北京 100049;3鹽城師范學(xué)院信息工程學(xué)院,江蘇 鹽城 224002
前列腺癌是男性常見(jiàn)的泌尿生殖系統(tǒng)腫瘤,研究通過(guò)調(diào)查近幾年的前列腺癌流行病學(xué)發(fā)現(xiàn)發(fā)達(dá)國(guó)家前列腺癌發(fā)病率及死亡率逐漸降低或趨于穩(wěn)定[1]。而中國(guó)前列腺癌近5年發(fā)病率為16.8/100 000,且每年以2.6%的速率在增長(zhǎng)。目前其診斷主要是依靠血清前列腺特異抗原(PSA)、直腸指診、經(jīng)直腸超聲、多參數(shù)MRI等進(jìn)行評(píng)估,最終通過(guò)前列腺穿刺活檢確診。面對(duì)大量的臨床數(shù)據(jù),需要耗費(fèi)更多的醫(yī)療資源去判斷病變穿刺的可能性,并且過(guò)度穿刺會(huì)給患者帶來(lái)出血、感染等風(fēng)險(xiǎn)。預(yù)測(cè)前列腺癌病患,提高前列腺癌的診斷效率是前列腺癌診斷研究的重點(diǎn)問(wèn)題之一。
近年來(lái),人工智能技術(shù)在醫(yī)學(xué)領(lǐng)域得到廣泛應(yīng)用。機(jī)器學(xué)習(xí)方法從大量醫(yī)學(xué)數(shù)據(jù)中提取知識(shí)信息,對(duì)病患預(yù)測(cè)具有重要的研究意義和實(shí)用價(jià)值?;跈C(jī)器學(xué)習(xí)方法的預(yù)測(cè)模型可以較好的輔助精準(zhǔn)診斷以及超早期預(yù)警,從而提高醫(yī)生診斷效率,降低醫(yī)療成本,并減少穿刺活檢風(fēng)險(xiǎn)。目前,國(guó)內(nèi)外僅少數(shù)學(xué)者聯(lián)合前列腺影像報(bào)告和數(shù)據(jù)系統(tǒng)第2版及PSA運(yùn)用支持向量機(jī)、決策樹(shù)和Logistic回歸等機(jī)器學(xué)習(xí)模型對(duì)前列腺癌的診斷價(jià)值進(jìn)行預(yù)測(cè)研究[2-4]。然而,以往研究主要基于前列腺影像報(bào)告與數(shù)據(jù)系統(tǒng)(PI-RADS)v2.0,分類(lèi)模型種類(lèi)不夠豐富,且模型評(píng)估相對(duì)單一。本研究采用最新的PIRADSv2.1版本[5],并且運(yùn)用5種機(jī)器學(xué)習(xí)方法,包括使用決策樹(shù)、K近鄰、樸素貝葉斯、隨機(jī)森林、支持向量機(jī)等5種分類(lèi)器對(duì)多個(gè)醫(yī)學(xué)數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)[6-7],利用靈敏度、特異度、查準(zhǔn)率、召回率、F1值、ROC、AUC以及特征重要性等評(píng)價(jià)指標(biāo)比較不同預(yù)測(cè)模型在前列腺癌診斷中的準(zhǔn)確性,分析這5種模型用于診斷前列腺癌的特點(diǎn)。
選取2017年6月~2020年1月在航天中心醫(yī)院接受多參數(shù)3.0 T MRI檢查的前列腺疾病患者242例,年齡35~93歲(73.7±10.7歲)。其中前列腺癌組104例,非前列腺癌組138例。納入標(biāo)準(zhǔn):所有患者均接受經(jīng)直腸前列腺穿刺活檢或前列腺切除病理證實(shí),并且獲得前列腺癌Gleason評(píng)分;檢查前均未接受任何前列腺相關(guān)臨床治療;臨床資料齊全;穿刺或術(shù)前接受MRI檢查,并且MRI圖像清晰。排除標(biāo)準(zhǔn):臨床資料不全,無(wú)病理結(jié)果;MRI檢查前接受相關(guān)臨床治療;MRI圖像質(zhì)量不佳,不能用于評(píng)估。
采用西門(mén)子公司Siemens Magnetom Skyra 3.0 T掃描儀,相控陣體線圈。掃描序列及參數(shù)包括:軸位T1WI、T2WI,層厚為3 mm,層間距為3.3 mm,DWI序列(b值取0、50和3 000 s/mm2),DCE-MRI(采用容積式插入法屏氣檢查序列團(tuán)注對(duì)比劑)。掃描范圍覆蓋前列腺底部至前列腺尖部。
通過(guò)查閱臨床信息系統(tǒng)查閱相關(guān)臨床資料,包括年齡、總PSA濃度(tPSA)、游離PSA濃度(fPSA)、游離前列腺抗原比值(fPSA/tPSA)、前列腺體積(V)、PSA密度(PSAD)、PI-RADS v2.1評(píng)分以及病理結(jié)果。其中,在T2WI上結(jié)合軸位、冠狀位和矢狀位圖像測(cè)量前列腺前后徑、左右徑及上下徑,根據(jù)公式計(jì)算V及PSAD:V=前后徑×左右徑×上下徑×0.52,PSAD=tPSA/V。PIRADS v2.1評(píng)分由2名具有5年工作經(jīng)驗(yàn)的影像學(xué)診斷醫(yī)師利用雙盲法評(píng)出。
1.4.1 分類(lèi)預(yù)測(cè)模型 本文用決策樹(shù)、K近鄰、樸素貝葉斯、隨機(jī)森林、支持向量機(jī)分類(lèi)器分別對(duì)前列腺癌建立預(yù)測(cè)模型,輸入變量包括7個(gè)評(píng)價(jià)因素(年齡、tPSA、fPSA、fPSA/tPSA、V、PI-RADS、PSAD),分析5種學(xué)習(xí)模型診斷前列腺癌的準(zhǔn)確率。本文進(jìn)行數(shù)據(jù)分類(lèi)預(yù)測(cè)模型的流程(圖1)。
本文給出的對(duì)前列腺癌的分類(lèi)預(yù)測(cè)模型在收集數(shù)據(jù)、提取了測(cè)試樣本后,使用患者的年齡、tPSA、fPSA、fPSA/tPSA、V及PSAD、PI-RADS v2.1評(píng)分作為特征變量,采用隨機(jī)抽樣的方式進(jìn)行數(shù)據(jù)分割,然后在數(shù)據(jù)庫(kù)中選擇一種分類(lèi)器對(duì)前列腺癌與非前列腺癌進(jìn)行訓(xùn)練和分類(lèi)建立預(yù)測(cè)模型,最后針對(duì)前列腺癌與非前列腺癌進(jìn)行結(jié)果分析。
1.4.2 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集 實(shí)驗(yàn)選擇Windows 10×64操作系統(tǒng),Inter Core i7-4790@3.60 GHz處理器,16 GB內(nèi)存的PC。開(kāi)發(fā)工具為Python 3.6。數(shù)據(jù)集來(lái)源為航天中心醫(yī)院臨床脫敏前列腺疾病患者信息共242例,隨機(jī)抽樣選出80%(n=194)作為訓(xùn)練集,用于篩選變量和建立預(yù)測(cè)模型;20%(n=48)作為測(cè)試集,用于評(píng)價(jià)模型預(yù)測(cè)效果。
1.4.3 評(píng)價(jià)指標(biāo) 本文對(duì)5種分類(lèi)預(yù)測(cè)模型使用的評(píng)價(jià)標(biāo)準(zhǔn)是機(jī)器學(xué)習(xí)普遍使用的性能評(píng)價(jià)指標(biāo)。包括了特異度、敏感度、ROC曲線和AUC、精確度、查準(zhǔn)率、召回率、F1值,針對(duì)樹(shù)類(lèi)分類(lèi)器(決策樹(shù)和隨機(jī)森林)對(duì)特征做重要性分析。為了綜合考慮查準(zhǔn)率和召回率,本文使用F1值作為模型對(duì)比的最終評(píng)價(jià)指標(biāo)。
本文對(duì)數(shù)據(jù)集的變量信息,通過(guò)特征熱圖分析相關(guān)性。特征熱圖可以直觀反應(yīng)與目標(biāo)變量相關(guān)的特性。對(duì)年齡、tPSA、fPSA、fPSA/tPSA、V及PSAD、PI-RADS v2.1評(píng)分之間的交互關(guān)聯(lián)作用(圖2)。其中,方框中顏色的深淺代表了兩指標(biāo)的交互關(guān)聯(lián)程度。顏色越淺則關(guān)聯(lián)程度越高;反之,關(guān)聯(lián)程度越低。例如,主對(duì)角線是相同變量則相關(guān)度最高;PI-RADS與fPSA/tPSA是兩種不同的醫(yī)學(xué)檢查指標(biāo),關(guān)聯(lián)程度低,則顏色最深。
對(duì)5種機(jī)器學(xué)習(xí)模型經(jīng)訓(xùn)練學(xué)習(xí)后診斷前列腺癌實(shí)驗(yàn)的評(píng)價(jià)指標(biāo)結(jié)果顯示,F(xiàn)1值最高的為隨機(jī)森林模型,其次依序?yàn)闃闼刎惾~斯、決策樹(shù)、K近鄰,支持向量機(jī)模型最?。ū?)。
這5種學(xué)習(xí)模型ROC曲線及其ROC曲線下面積(AUC)比較(圖3)。AUC比較結(jié)果為:隨機(jī)森林>樸素貝葉斯>決策樹(shù)>K近鄰>支持向量機(jī),此結(jié)果與F1值一致。
通過(guò)隨機(jī)森林和決策樹(shù)模型計(jì)算各特征變量重要性,并按所占比例進(jìn)行排序。結(jié)果顯示,這兩種模型中PI-RADS v2.1評(píng)分均占比例最大,其次為PSAD、V,另外檢查指標(biāo)fPSA、fPSA/tPSA也對(duì)分類(lèi)起一定的作用。除此以外,在隨機(jī)森林模型中,年齡對(duì)模型分類(lèi)貢獻(xiàn)最低,決策樹(shù)模型性年齡貢獻(xiàn)幾乎為零(圖4)。
表1 5種機(jī)器學(xué)習(xí)模型診斷前列腺癌的結(jié)果Tab.1 Results of 5 machine learning models in the diagnosis of prostate cancer
機(jī)器學(xué)習(xí)專(zhuān)門(mén)研究計(jì)算機(jī)怎樣模擬人類(lèi)的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,從而將已有的知識(shí)結(jié)構(gòu)重組使之不斷提升自我的性能,屬于多領(lǐng)域交叉學(xué)科[8-10],已成為預(yù)測(cè)疾病的主流方法。目前,機(jī)器學(xué)習(xí)方法被廣泛應(yīng)用于圖像處理,如圖像分類(lèi)、圖像分割、圖像識(shí)別和圖像配準(zhǔn)等[11-14]。近年來(lái),機(jī)器學(xué)習(xí)在基于影像大數(shù)據(jù)的前列腺相關(guān)疾病的輔助診斷領(lǐng)域中起著舉足輕重的作用。
本研究將PI-RADS v2.1評(píng)分及相關(guān)臨床數(shù)據(jù)等指標(biāo)作為變量,以數(shù)學(xué)方式近似表達(dá)各變量的內(nèi)在規(guī)律。本文采用決策樹(shù)、K近鄰、樸素貝葉斯、隨機(jī)森林、支持向量機(jī)分類(lèi)器,建立前列癌分類(lèi)預(yù)測(cè)模型,對(duì)其結(jié)果進(jìn)行對(duì)比分析。結(jié)果表明,5種模型F1值、AUC的結(jié)果為隨機(jī)森林>樸素貝葉斯>決策樹(shù)>K近鄰>支持向量機(jī)。有研究結(jié)合紋理分析、MR動(dòng)態(tài)增強(qiáng)定量分析、PI-RADS評(píng)分和部分臨床資料建立Logistic回歸、逐步回歸、經(jīng)典決策樹(shù)、條件推斷樹(shù)、隨機(jī)森林和支持向量機(jī)模型中發(fā)現(xiàn)隨機(jī)森林模型診斷臨床顯著癌優(yōu)于其他模型,支持向量機(jī)模型次之[15]。PSAD和紋理分析相關(guān)參數(shù)診斷CSPC的重要性高于PI-RADS評(píng)分和動(dòng)態(tài)增強(qiáng)MRI定量參數(shù)。曾小輝等[2]在建立基于前列腺影像報(bào)告和數(shù)據(jù)系統(tǒng)第2版的支持向量機(jī)、決策樹(shù)和Logistic回歸3種機(jī)器學(xué)習(xí)模型,發(fā)現(xiàn)這3種模型對(duì)高級(jí)別前列腺癌的診斷價(jià)值均較好,決策樹(shù)模型可作為預(yù)測(cè)前列腺高級(jí)別癌的較優(yōu)模型。Bermejo等[3]認(rèn)為基于前列腺特異性抗原等單獨(dú)生物指標(biāo)不能很好地診斷前列腺癌,故聯(lián)合年齡、PSA、直腸指檢、多參數(shù)MR等指標(biāo)建立決策樹(shù)和Logistic回歸模型,認(rèn)為2種模型診斷前列腺癌的準(zhǔn)確率均較好。上述結(jié)果與本研究結(jié)果一致,說(shuō)明隨機(jī)森林與決策樹(shù)模型在預(yù)測(cè)前列腺癌的準(zhǔn)確率均較好。有研究評(píng)價(jià)年齡、PSA以及經(jīng)直腸前列腺超聲影像特征構(gòu)建的TAN貝葉斯網(wǎng)絡(luò)模對(duì)前列腺癌預(yù)測(cè)的準(zhǔn)確率為85.11%,預(yù)測(cè)效果較好,可作為臨床篩查或診斷前列腺癌的一種方法[16]。本研究發(fā)現(xiàn)樸素貝葉斯ROC曲線下面積及F1值均較高,貝葉斯理論在數(shù)據(jù)集信息的基礎(chǔ)上引入了先驗(yàn)信息[17],綜合考察數(shù)據(jù)集和先驗(yàn)信息實(shí)現(xiàn)對(duì)總體做出推斷。經(jīng)典統(tǒng)計(jì)模型容易受到嚴(yán)格的假定條件限制[18],如Logistic回歸要求因變量服從指數(shù)分布,因變量的邏輯轉(zhuǎn)換后與預(yù)測(cè)變量之間服從線性假定;而且Logistic回歸模型的預(yù)測(cè)往往基于有統(tǒng)計(jì)學(xué)意義的變量,貝葉斯模型充分利用所有變量信息,對(duì)結(jié)果的預(yù)測(cè)也更為全面。
本文應(yīng)用決策樹(shù)和隨機(jī)森林模型對(duì)前列腺癌診斷模型中的變量進(jìn)行特征重要性分類(lèi),發(fā)現(xiàn)PI-RADS v2.1評(píng)分對(duì)于前列腺癌評(píng)估影響最大,多參數(shù)MRI在前列腺癌的診斷中起著舉足輕重的作用。針對(duì)大量的影像數(shù)據(jù)以及影像醫(yī)師的診斷偏差,美國(guó)放射學(xué)會(huì)聯(lián)手歐洲泌尿生殖放射學(xué)會(huì)制定了前列腺影像與數(shù)據(jù)報(bào)告系統(tǒng),2019年P(guān)I-RADS指導(dǎo)委員會(huì)在掃描技術(shù)、移行區(qū)、中央?yún)^(qū)及前纖維基質(zhì)區(qū)病變?cè)u(píng)分進(jìn)一步細(xì)化,將PIRADS v2.0修訂為PI-RADS v2.1[5]。有研究建立多參數(shù)MRI PI-RADS v1評(píng)分和臨床數(shù)據(jù)相結(jié)合的Logistic模型,預(yù)測(cè)前列腺癌的AUC為0.88[4],對(duì)重要前列腺癌進(jìn)行個(gè)體化風(fēng)險(xiǎn)評(píng)估,可以大大減少不必要的活檢,并降低過(guò)度檢測(cè)無(wú)關(guān)前列腺癌的風(fēng)險(xiǎn)。本研究使用的評(píng)分標(biāo)準(zhǔn)為PI-RADS v2.1,且細(xì)化了對(duì)前列腺疾病的影像診斷評(píng)估。
本實(shí)驗(yàn)結(jié)果表明,除了PI-RADS v2.1評(píng)分,前列腺特異性抗原密度在前列腺癌模型的比重也較大。PSA近年來(lái)被廣泛應(yīng)用于前列腺癌的篩查。然而,PSA水平的升高也可以代表良性前列腺增生和前列腺炎的發(fā)生,這對(duì)PSA預(yù)測(cè)前列腺癌的特異性提出了質(zhì)疑。因而引入了前列腺特異性抗原密度PSAD[19],前列腺癌患者血清中PSA與前列腺體積不成比例地升高,使用PSAD來(lái)診斷前列腺癌較PSA更為準(zhǔn)確。另外,由于基于樹(shù)的模型需要做特征選擇,選擇具有更高價(jià)值特征就會(huì)影響分類(lèi)結(jié)果,而其他如線性學(xué)習(xí)器不做特征選擇。本文僅對(duì)決策樹(shù)和隨機(jī)森林進(jìn)行特征重要性分析。樸素貝葉斯及K近鄰為線性學(xué)習(xí)器,因而沒(méi)有做特征重要性分析。
本研究的創(chuàng)新之處采用最新的前列腺影像報(bào)告與數(shù)據(jù)系統(tǒng)版本(PI-RADS v2.1),聯(lián)合年齡、tPSA、fPSA、游離PSA百分比、前列腺體積及PSA密度多種指標(biāo),運(yùn)用決策樹(shù)、K近鄰、樸素貝葉斯、隨機(jī)森林、支持向量機(jī)這5種機(jī)器模型對(duì)多個(gè)醫(yī)學(xué)指標(biāo)進(jìn)行預(yù)測(cè)學(xué)習(xí),利用靈敏度、特異度、查準(zhǔn)率、召回率、F1值、ROC、AUC以及特征重要性等多種評(píng)價(jià)指標(biāo)比較不同預(yù)測(cè)模型在前列腺癌診斷中的準(zhǔn)確性,分析這5種模型用于診斷前列腺癌的特點(diǎn)。結(jié)果發(fā)現(xiàn)隨機(jī)森林、樸素貝葉斯、決策樹(shù)分類(lèi)模型用于預(yù)測(cè)診斷前列腺癌具有更好的效果。隨機(jī)森林方法在5種機(jī)器學(xué)習(xí)模型中最優(yōu),且PI-RADS v2.1及PSAD變量的特征重要性表現(xiàn)更明顯。
綜上所述,本研究聯(lián)合運(yùn)用PI-RADS v2.1評(píng)分、PSAD等臨床數(shù)據(jù)采用決策樹(shù)、K近鄰、樸素貝葉斯、隨機(jī)森林、支持向量機(jī)分類(lèi)器,建立前列癌分類(lèi)預(yù)測(cè)模型。隨機(jī)森林方法、決策樹(shù)模型、貝葉斯模型機(jī)器學(xué)習(xí)模型F1值和AUC較高,實(shí)驗(yàn)表明預(yù)測(cè)前列腺癌的價(jià)值均較好,隨機(jī)森林模型可作為預(yù)測(cè)前列腺癌的較優(yōu)模型,同時(shí)PI-RADS v2.1及PSAD在前列腺癌診斷中特征重要性表現(xiàn)更明顯。本文研究的局限性在于:本研究小樣本量數(shù)據(jù),且為回顧性分析,可能存在選擇性偏倚,今后進(jìn)一步擴(kuò)大樣本量分析;數(shù)據(jù)樣本存在不平衡的問(wèn)題,如檢查與影像結(jié)果一致,而病理結(jié)果不一致,導(dǎo)致分類(lèi)效果差;本研究為單中心數(shù)據(jù),今后希望建立多中心、大數(shù)據(jù)的病例集。