廖 蔚,黃 強(qiáng),張雅琳,高雪梅,梅 劼,
(1.西南醫(yī)科大學(xué)臨床醫(yī)學(xué)院,四川 瀘州 646000; 2.四川省醫(yī)學(xué)科學(xué)院·四川省人民醫(yī)院產(chǎn)科,四川 成都 610072; 3.電子科技大學(xué)臨床醫(yī)學(xué)院,四川 成都 610072)
卵巢惡性腫瘤早期多無特異性癥狀,因缺乏有效的早期診斷手段,當(dāng)出現(xiàn)癥狀時(shí)往往已經(jīng)進(jìn)入晚期,因此卵巢惡性腫瘤患者的五年生存率低。相關(guān)研究表明,卵巢惡性腫瘤若能早期發(fā)現(xiàn)、及時(shí)準(zhǔn)確的治療,患者五年生存率則可以得到的改善[1]。因此,若能找到一項(xiàng)對卵巢惡性腫瘤的早診斷有幫助的新技術(shù),就可能幫助患者改善預(yù)后。經(jīng)陰道超聲是目前臨床上篩查卵巢惡性腫瘤的最常用的影像學(xué)手段,但腸道氣體干擾、偽影、強(qiáng)度衰減、難以攝取全部圖像、重疊等因素使其應(yīng)用存在一定局限性,導(dǎo)致篩查特異性低,甚至誤診[2]。計(jì)算機(jī)斷層掃描(computed tomography,CT)檢查可更好地顯示腫塊組織特征和判斷與周圍器官的關(guān)系,增強(qiáng)CT在卵巢腫瘤的診斷、術(shù)前評估、指導(dǎo)臨床治療中發(fā)揮著重要的作用[3]。但是在醫(yī)學(xué)成像領(lǐng)域,疾病的準(zhǔn)確診斷取決于圖像采集和圖像解釋[4],依賴于醫(yī)生的技術(shù)水平和個(gè)人經(jīng)驗(yàn),存在較大的主觀性,尤其是住院醫(yī)師以及偏遠(yuǎn)基層醫(yī)院的影像醫(yī)師,他們臨床經(jīng)驗(yàn)有限,通過增強(qiáng)CT對卵巢腫瘤良惡性進(jìn)行鑒別是有困難的。而人工智能在幫助我們提高診斷的準(zhǔn)確性和客觀性上有著巨大的潛力。
深度學(xué)習(xí)(deep learning, DL)技術(shù)是目前人工智能(artificial intelligence,AI)領(lǐng)域的核心技術(shù),它模仿人腦的神經(jīng)網(wǎng)絡(luò)[5],能夠?qū)W習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,對原始數(shù)據(jù)處理能力強(qiáng)[6]。它的最終目標(biāo)是讓計(jì)算機(jī)能夠像人一樣具有分析學(xué)習(xí)能力,能夠識別文字、圖像和聲音等數(shù)據(jù)。近幾年來,基于深度學(xué)習(xí)的圖像分析的相關(guān)研究已經(jīng)涉及肝臟、腦部、甲狀腺、血管等部位[7~10]以及惡性腫瘤(如乳腺癌、肝臟癌癥)等病灶組織的識別[11],它不僅提高了醫(yī)學(xué)影像處理效率,還能夠通過算法和預(yù)處理等操作提高處理精度。
本次研究嘗試尋找適合卵巢腫瘤良惡性分類的深度學(xué)習(xí)模型。我們利用卵巢腫瘤患者的增強(qiáng)CT圖像對深度學(xué)習(xí)中的NASNet神經(jīng)網(wǎng)模型進(jìn)行訓(xùn)練,以手術(shù)后的組織病理學(xué)檢查結(jié)果為確診標(biāo)準(zhǔn),建立基于卵巢腫瘤增強(qiáng)CT圖像良惡性預(yù)測二分類模型,評估其在鑒別卵巢包塊良惡性的臨床價(jià)值。在研究中將建立的DL模型同影像專科主治醫(yī)師的診斷水平做比較,以此來證明我們建立的DL模型可以在影像科住院醫(yī)師及基層醫(yī)生通過CT判斷卵巢腫瘤良惡性時(shí)提供比較準(zhǔn)確的結(jié)果供他們參考。
1.1 一般資料收集2018年7月至2022年5月在四川省人民醫(yī)院因卵巢腫瘤住院行盆腹腔增強(qiáng)CT檢查的114例卵巢腫瘤患者,對患者信息進(jìn)行脫敏處理后編號,其中1~75號為術(shù)后病理檢查確診為惡性腫瘤患者,76~114號為確診為良性腫瘤患者。按2∶1的比例隨機(jī)劃分為訓(xùn)練集和測試集。在PACS系統(tǒng)中選取盆腹腔增強(qiáng)CT圖中病灶區(qū)域完整且邊緣清晰易于標(biāo)注的圖像,其中訓(xùn)練集76例共計(jì)2991幅圖像,包含惡性腫瘤病例50例1698幅圖像,良性腫瘤病例26例1293幅圖像。測試集38例共2050幅圖像,惡性腫瘤病例25例1284幅圖像,良性腫瘤患者病例13例766幅圖像。存儲為醫(yī)學(xué)數(shù)字成像和通信(digital imaging and communications in medicine, DICOM)格式。
1.2 方法
1.2.1訓(xùn)練集標(biāo)簽圖制作及模型的建立 為了最大程度保證訓(xùn)練數(shù)據(jù)的準(zhǔn)確性與客觀性,由一名影像??浦髦吾t(yī)師手動勾畫出訓(xùn)練集卵巢病灶的邊界。標(biāo)簽值分為兩類,標(biāo)注的區(qū)域?yàn)椴≡?,其余為背景。?biāo)注完成后,使用Python腳本生成遮罩圖像,考慮到直接使用原始增強(qiáng)CT圖像會引入大量與腫瘤良惡性判斷無關(guān)的干擾信息,最終選擇通過分割后的遮罩圖確定原始增強(qiáng)CT圖像中腫瘤的位置,隱去其余部分得到僅包含腫瘤組織的增強(qiáng)CT圖像, 將完成預(yù)處理后的訓(xùn)練集數(shù)據(jù)預(yù)處理送入NASNet神經(jīng)網(wǎng)絡(luò)完成模型訓(xùn)練。
1.2.2分組測試 分別由影像專科主治醫(yī)師和訓(xùn)練成功的DL模型分別對測試集進(jìn)行良惡性診斷,在DL模型診斷測試集時(shí)使用本研究中同時(shí)建立的改進(jìn)U-Net模型算法對測試集進(jìn)行自動分割,所得分割結(jié)果經(jīng)訓(xùn)練后的NASNet神經(jīng)網(wǎng)絡(luò)分類。測試結(jié)果中,單個(gè)病例的CT圖像惡性占比超過34%即患者判定為惡性患者。將分類結(jié)果同影像??浦髦吾t(yī)師的判斷結(jié)果做比較。
1.3 觀察指標(biāo)計(jì)算DL模型分類的靈敏度、特異度、準(zhǔn)確性、AUC作為衡量模型效能的指標(biāo)。利用約登指數(shù)(Yu-denlndx,YI)最大法確定單個(gè)病例判定為惡性腫瘤的CT圖片百分比閾值。
1.4 統(tǒng)計(jì)學(xué)方法應(yīng)用SPSS 22.0統(tǒng)計(jì)學(xué)軟件對數(shù)據(jù)進(jìn)行分析。統(tǒng)計(jì)學(xué)方法使用配對卡方檢驗(yàn)以及Kappa一致性檢驗(yàn)。Kappa值>0.75表示組間比較一致性好。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 自動分割結(jié)果利用本研究同時(shí)建立的改良U-Net算法模型實(shí)現(xiàn)測試集的自動分割,實(shí)現(xiàn)了分割-診斷自動化。即由U-Net分割模型自動勾畫出卵巢腫瘤病灶(如圖1、2),然后提供給NASNet神經(jīng)網(wǎng)模型實(shí)現(xiàn)良惡性自動預(yù)測。圖1圖2中,a列代表原始圖,b列代表手動勾畫邊界,c列代表自動分割邊界,d列代表分割耦合圖像。在分割耦合圖像中,深黃色區(qū)域代表模型的分割結(jié)果,綠色區(qū)域代表標(biāo)簽手動分割圖像??梢钥闯鲎詣臃指畹慕Y(jié)果與影像??漆t(yī)師手動分割的結(jié)果高度吻合,可以為NASNet神經(jīng)網(wǎng)絡(luò)分類模型提供準(zhǔn)確的測試標(biāo)簽。
圖1 惡性腫瘤病例使用改進(jìn)U-Net自動分割效果
圖2 良性腫瘤病例使用改進(jìn)U-Net分割效果
2.2 分類測試結(jié)果最大YI為0.769,對應(yīng)閾值的惡性圖片占比為34%,此情況下模型的靈敏度為100%,特異度為76.9%,準(zhǔn)確度為92.1%,AUC為0.88(如圖3)。影像??浦髦吾t(yī)師對測試集良惡性診斷的靈敏度為96%,特異性84.6%,準(zhǔn)確性92.1%。通過U-Net分割模型對分類模型自動提供標(biāo)簽,約21分鐘就對38例測試患者完成了良惡性的判斷,而影像??浦髦吾t(yī)師耗時(shí)約為5.5小時(shí)。影像專科主治醫(yī)師同DL模型診斷效果比較差異無統(tǒng)計(jì)學(xué)意義(P>0.05);Kappa=0.872(Kappa>0.75),兩者診斷效能高度一致。見表1。
表1 DL模型與影像??浦髦吾t(yī)師測試結(jié)果比較 (n)
圖3 DL模型診斷卵巢腫瘤良惡性的ROC曲線圖
卵巢惡性腫瘤若能早期發(fā)現(xiàn),及早治療,則可以擁有較好的五年生存率[1]。CT檢查成像結(jié)果在卵巢腫瘤疾病診斷、手術(shù)術(shù)前評估、指導(dǎo)臨床治療中發(fā)揮著重要的作用,但醫(yī)學(xué)影像診斷始終存在主觀性,會不可避免的造成對部分圖像診斷的偏差。同時(shí),我國醫(yī)療影像數(shù)據(jù)每年30%的速度增長,而影像醫(yī)生的年增速僅為 4%~6%[12],人工讀片的效率低,花費(fèi)時(shí)間多,僅靠人工讀片已難以滿足影像數(shù)據(jù)增加所帶來的需求。因此,我們嘗試在深度學(xué)習(xí)技術(shù)中尋找合適的算法模型,結(jié)合卵巢腫瘤的增強(qiáng)CT圖建立預(yù)測卵巢腫瘤良惡性的二分類模型。
在本研究中,我們利用卵巢腫瘤患者的增強(qiáng)CT圖片訓(xùn)練了深度學(xué)習(xí)中的NASNet神經(jīng)網(wǎng)絡(luò)模型,建立了預(yù)測卵巢腫瘤良惡性的二分類模型,預(yù)測的靈敏度為100%,特異度為76.9%,準(zhǔn)確度為92.1%,AUC為0.88。相對于影像??浦髦吾t(yī)師,DL分類模型顯示出更高的靈敏度,類似的準(zhǔn)確性和稍差的特異性。兩者的診斷效果在通過配對卡方檢驗(yàn)在統(tǒng)計(jì)學(xué)上相比較P值為0.5>0.05,兩者差異無統(tǒng)計(jì)學(xué)意義。通過kappa一致性檢驗(yàn)對比,Kappa值為0.872>0.75,說明本DL模型對卵巢腫瘤良惡性的預(yù)測結(jié)果與影像??浦髦吾t(yī)師的診斷結(jié)果有高度的一致性,且DL模型的效率約是影像??浦髦吾t(yī)師的16倍,效率更高。既往研究中,Liu[13]等發(fā)表的Meta分析指出CT診斷惡性卵巢腫瘤的靈敏度可以達(dá)到85%,特異性達(dá)86%;Dodge等[14]發(fā)表的系統(tǒng)綜述指出CT對可疑為卵巢惡性腫瘤的附件包塊診斷的靈敏度為87.2%,特異性為84.0%。而在傳統(tǒng)機(jī)器學(xué)習(xí)領(lǐng)域,Akazawa等[15]通過使用機(jī)器學(xué)習(xí)算法根據(jù)卵巢腫瘤患者的術(shù)前檢查數(shù)據(jù)建立模型預(yù)測卵巢腫瘤的病理診斷,最終得出梯度增強(qiáng)模型的預(yù)測準(zhǔn)確率最高可達(dá)到80%。Martinez-Mas等[16]通過分析348卵巢癌患者的超聲圖像特征,運(yùn)用機(jī)器學(xué)習(xí)算法建立分類模型,最優(yōu)的分類模型對卵巢腫瘤的良惡分類的準(zhǔn)確率可以達(dá)到85%。本研究利用卵巢腫瘤增強(qiáng)CT圖像建立的DL分類模型對卵巢腫瘤良惡性的判定結(jié)果與影像??浦髦吾t(yī)師有較好的一致性。而對比之前建立的傳統(tǒng)機(jī)器學(xué)習(xí)模型,深度學(xué)習(xí)技術(shù)應(yīng)用于診斷卵巢腫瘤良惡性的效果也更好,且可自動提取原始數(shù)據(jù)的特征,效率更高,模型的效能更是會隨著訓(xùn)練數(shù)據(jù)量的增加而增加。但相對于經(jīng)驗(yàn)豐富的影像專科醫(yī)生,本研究所建的分類模型特異性相對低,因此需要在測試中不斷反饋良性腫瘤的數(shù)據(jù),提高模型的特異性。
在模型建立的過程中,總體病例數(shù)較小可能是影響模型特異性相對偏低的一個(gè)原因。此外,訓(xùn)練集中良性患者病例少于惡性患者病例,這也可能導(dǎo)致本分類模型在測試時(shí)將結(jié)果偏向數(shù)據(jù)量更大的惡性患者,導(dǎo)致出現(xiàn)假陽性,引起特異性低。但是深度學(xué)習(xí)技術(shù)的模型性能會隨著訓(xùn)練數(shù)據(jù)的提升而改善,因此,只要不斷的補(bǔ)充數(shù)據(jù)進(jìn)行訓(xùn)練,分類模型的性能就能得到提升。
利用深度學(xué)習(xí)技術(shù)對醫(yī)學(xué)圖像進(jìn)行分割的相關(guān)研究在近幾年也迅速興起。本研究中分類模型測試集分割則采用在本研究中同時(shí)建立的改良的U-net分割模型進(jìn)行,分割結(jié)果如圖1、圖2,自動分割的結(jié)果與影像??漆t(yī)師手動分割的結(jié)果高度吻合,可以為NASNet神經(jīng)網(wǎng)絡(luò)分類模型提供準(zhǔn)確的測試標(biāo)簽,實(shí)現(xiàn)了卵巢腫瘤CT圖像的自動分割到良惡性診斷一體化,工作效率相較于影像科??浦髦吾t(yī)生大大提高。未來,我們還計(jì)劃將患者的術(shù)前腫瘤標(biāo)志物同卵巢腫瘤的增強(qiáng)CT的圖像相結(jié)合,建立一個(gè)融合模型來預(yù)測卵巢腫瘤的良惡性,進(jìn)一步提升模型的診斷效能。
本研究也存在很多局限性,此研究為單一的醫(yī)療中心進(jìn)行的回顧性研究,病例數(shù)量相對較少,尤其是良性腫瘤患者的增強(qiáng)CT數(shù)據(jù)收集較困難,因此分類模型可能出現(xiàn)過度擬合[17]。模型的性能需要在未來的多中心研究、前瞻性研究中進(jìn)一步得到驗(yàn)證并且進(jìn)行反饋優(yōu)化。
綜上,利用卵巢腫瘤增強(qiáng)CT圖像訓(xùn)練得到的DL二分類模型對卵巢良惡性的判斷具有較好的靈敏度、準(zhǔn)確度、特異度,在卵巢腫瘤良惡性判別上是可行的,且結(jié)合U-net自動分割模型可以提高工作效率。