祝小惟,萬(wàn) 鵬,張道強(qiáng),程 樂(lè),王 毅
(1.南京航空航天大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,南京 211106;2.南京鼓樓醫(yī)院醫(yī)學(xué)影像科,南京 210008;3.南京鼓樓醫(yī)院神經(jīng)外科,南京 210008)
腦出血是一種發(fā)生在顱內(nèi)的原發(fā)性腦實(shí)質(zhì)內(nèi)出血,發(fā)生后1 個(gè)月內(nèi)死亡率可達(dá)40%[1],所以盡早有效治療至關(guān)重要。門急診中主要基于非造影劑增強(qiáng)的頭部CT 掃描成像進(jìn)行腦出血的診斷工作,且依賴放射科醫(yī)生的閱片過(guò)程,這一重復(fù)且重要的步驟要求醫(yī)生具有相當(dāng)程度的專業(yè)知識(shí)、豐富的經(jīng)驗(yàn)以及一定的速度和效率。因此隨著計(jì)算機(jī)技術(shù)和人工智能方法的不斷發(fā)展,希望能將機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法應(yīng)用于醫(yī)學(xué)影像上,對(duì)醫(yī)生的診療工作進(jìn)行輔助,對(duì)病癥快速準(zhǔn)確地識(shí)別以便盡快開(kāi)始治療。
值得注意的是,人工智能在臨床醫(yī)學(xué)中的應(yīng)用存在許多問(wèn)題。首先患者腦CT 影像中亮度不同程度衰減的現(xiàn)象[2]和腦出血多種類型的存在,為腦出血的自動(dòng)化識(shí)別帶來(lái)了挑戰(zhàn)[3]。另外,智能診斷的方法不同于醫(yī)生的診斷,作為黑箱模型存在可信度的局限,因此考慮到實(shí)際應(yīng)用,需要提高模型的可解釋性,為診斷結(jié)果提供依據(jù),同時(shí)方便醫(yī)生對(duì)結(jié)果的正確性進(jìn)行檢查。更重要的是,臨床上漏檢的腦出血將可能帶來(lái)加重病情貽誤治療時(shí)機(jī)等嚴(yán)重的后果,也就是說(shuō),對(duì)于計(jì)算機(jī)輔助得到的結(jié)果,假陰性將產(chǎn)生比假陽(yáng)性的結(jié)果更大的危害,這種代價(jià)的不平衡也是醫(yī)學(xué)問(wèn)題中一大特點(diǎn)。因此實(shí)際應(yīng)用時(shí)除了一般地要求模型方法具有一定程度的準(zhǔn)確性,尤其更要盡可能減少漏檢的發(fā)生,也即更加注重提升模型的敏感性。目前,許多前沿方法已被越來(lái)越多地應(yīng)用在腦出血疾病中,基于CT 圖像的腦出血智能篩檢的方式和途徑主要包括直接給出有無(wú)出血或出血類型診斷結(jié)果,以及對(duì)出血區(qū)域提取和分割等。
在進(jìn)行直接診斷的方法中,Dawud 等[4]基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)、AlexNet、AlexNet-SVM 三種深度學(xué)習(xí)模型將含有多種類型腦出血的CT 圖像分為正常和出血兩類,并證明了在遷移學(xué)習(xí)中從自然圖像到醫(yī)學(xué)圖像分類的知識(shí)轉(zhuǎn)移是可行的;Togacar 等[5]通過(guò)自動(dòng)編碼器從原始數(shù)據(jù)集生成新的數(shù)據(jù)集,熱力圖處理并擴(kuò)充后利用AlexNet 和SVM 分類器區(qū)分出包含出血的圖像;Grewal 等[6]分析了三維的掃描級(jí)腦CT 圖像數(shù)據(jù),在斷層圖像中關(guān)注有出血潛力的區(qū)域后,利用長(zhǎng)短時(shí)記憶整合相鄰圖像中的上下文信息得到診斷結(jié)果;而Arbabshirani 等[7]基于大型的頭部CT 研究臨床數(shù)據(jù)庫(kù)開(kāi)發(fā)了一個(gè)三維CNN 模型,分析掃描級(jí)的CT 影像數(shù)據(jù)來(lái)識(shí)別腦出血,在臨床中對(duì)放射學(xué)工作列表進(jìn)行排序,顯著減少了門診腦出血的平均診斷時(shí)間,優(yōu)化了放射科的工作流程;Menon 等[8]基于Inception V3 和DenseNet 模型診斷腦出血的發(fā)生,并設(shè)計(jì)特殊的窗口技術(shù)對(duì)相對(duì)較小的出血進(jìn)行關(guān)注,取得了良好的效果。在識(shí)別多出血類型方面,Hu 等[9]提出一種植入灰度共生矩陣(Gray level co-occurrence matrix,GLCM)的CNN 模型,從感興趣區(qū)域生成固定大小的GLCM 圖像,與原始圖像共同通過(guò)CNN 模型提取特征,增加網(wǎng)絡(luò)對(duì)重要病變區(qū)域的關(guān)注;而Le 等[10]則先對(duì)原始的DICOM 數(shù)據(jù)設(shè)置特定的窗口,對(duì)生成的圖像進(jìn)行邊界框標(biāo)記,并分別訓(xùn)練Faster R-CNN 和R-FCN 兩種模型來(lái)檢測(cè)4種類型的腦出血;Mushtaq 等[11]在研究中利用CNN 對(duì)腦出血分類任務(wù)進(jìn)行研究,并構(gòu)建了CNN+LSTM 和CNN+GRU 混合模型,關(guān)注小的不平衡數(shù)據(jù)集,使模型在現(xiàn)實(shí)應(yīng)用場(chǎng)景中能夠更好地識(shí)別多種腦出血的發(fā)生。
在對(duì)出血的具體區(qū)域進(jìn)行識(shí)別分割的工作中,Singh 等[12]利用傳統(tǒng)方法進(jìn)行顱內(nèi)出血區(qū)域的分割工作,改進(jìn)距離正則化水平集進(jìn)化算法,采用FCM 聚類初始化水平集函數(shù),獲得了較好的效果。Chang等[13]提出了一種二維與三維混合的DCNN 模型,基于Mask R-CNN 關(guān)注每個(gè)出血區(qū)域的分割和分類,并利用圖像周圍上下文信息,對(duì)不同類型的腦出血進(jìn)行了檢測(cè)和量化。Hidayatullah 等[14]提出了一種快速自動(dòng)分割CT 圖像的方法,通過(guò)圖像預(yù)處理消除圖像中的噪聲,使用傳統(tǒng)的分割方法將顱骨和腦組織分離,進(jìn)一步分割出血區(qū)域,計(jì)算腦出血體積。Zhao 等[15]則利用了在生物醫(yī)學(xué)成像分割任務(wù)中表現(xiàn)良好的nnU-Net 建立分割網(wǎng)絡(luò)架構(gòu),通過(guò)分割出血邊界從而幫助進(jìn)行腦出血及其亞型的識(shí)別和診斷。
目前已有工作考慮多種計(jì)算機(jī)輔助情形下的腦出血診斷問(wèn)題,然而也存在著一些局限性。首先,對(duì)具體出血區(qū)域進(jìn)行分割的方法往往意味著更大的數(shù)據(jù)標(biāo)注工作量,為了得到更優(yōu)良的模型以及驗(yàn)證模型分割是否精準(zhǔn),逐像素的邊界標(biāo)注是十分消耗時(shí)間和精力的。對(duì)于相比之下更加便捷的直接分類方法來(lái)說(shuō),則不需要大量的復(fù)雜標(biāo)記,但同時(shí)多數(shù)方法的診斷結(jié)果不如分割那么直觀,并且由于模型方法的黑箱特點(diǎn),模型得到結(jié)果的過(guò)程和依據(jù)并不可視。而實(shí)際臨床應(yīng)用中模型對(duì)結(jié)果的解釋能力往往有很大的意義,增加結(jié)果的可信性,能夠?yàn)獒t(yī)生基于診斷結(jié)果的進(jìn)一步復(fù)核和細(xì)檢有所幫助。除此之外,目前關(guān)于腦出血疾病的工作普遍忽略了模型方法在疾病方面應(yīng)用中的代價(jià)敏感問(wèn)題,這使得模型并不能夠很好地符合醫(yī)學(xué)場(chǎng)景。
考慮到綜上臨床應(yīng)用的特定需求,本文主要基于頭部CT 掃描得到的影像數(shù)據(jù)進(jìn)行個(gè)體的腦部狀況判斷,利用目標(biāo)檢測(cè)的方法對(duì)影像中的腦出血區(qū)域進(jìn)行識(shí)別和提取,識(shí)別包含出血的斷層圖像。這樣可以直觀地在圖像中定位到有觀察價(jià)值的特定區(qū)域,幫助醫(yī)生快速鎖定CT 掃描中的關(guān)鍵圖像,并且提高醫(yī)生的效率,同時(shí)便于直接地進(jìn)一步觀察到出血的范圍、形態(tài)和紋理等,方便醫(yī)生發(fā)現(xiàn)更細(xì)致的問(wèn)題。同時(shí)模型方法得到有無(wú)腦出血發(fā)生的診斷結(jié)果下,顯示具體出血能為診斷結(jié)果提供解釋,使得結(jié)果更有依據(jù)和可信度。最終提出的代價(jià)敏感Faster R-CNN 方法,通過(guò)引入錨的前景背景比例自動(dòng)化調(diào)節(jié)機(jī)制和帶有超參數(shù)的代價(jià)敏感損失函數(shù),使模型用于腦出血診斷時(shí)能夠更加警惕漏診情況的發(fā)生。為了提升模型的效果,在實(shí)驗(yàn)中對(duì)原始數(shù)據(jù)集進(jìn)行了處理,并針對(duì)檢測(cè)模型中錨的設(shè)計(jì),采用一種聚類的方式來(lái)得到適當(dāng)?shù)某跏汲叽绱笮?。在基于多個(gè)網(wǎng)絡(luò)結(jié)構(gòu)和超參數(shù)進(jìn)行實(shí)驗(yàn)的基礎(chǔ)上,得到最終的應(yīng)用模型。在檢測(cè)和診斷多方面的指標(biāo)考察下,該方法能夠從代價(jià)敏感的角度提升腦出血檢測(cè)效果,給出直觀可視的診斷依據(jù)和較為準(zhǔn)確的診斷結(jié)果。
Faster R-CNN 模型[16]在基于自然圖像的檢測(cè)問(wèn)題中被提出,用于解決自然場(chǎng)景下的實(shí)物目標(biāo)檢測(cè)和識(shí)別問(wèn)題,主要通過(guò)CNN、候選區(qū)域建議網(wǎng)絡(luò)(Region proposal network,RPN)、感興趣區(qū)域(Region of interest,ROI)池化層、以及框分類和回歸幾個(gè)部分共同實(shí)現(xiàn)。
CNN 對(duì)輸入圖像卷積以提取特征,生成的特征圖提供給RPN 部分,特征圖與原圖像存在映射關(guān)系。在輸入圖像每個(gè)位置生成9 個(gè)大小、形狀不同的錨,計(jì)算每個(gè)錨對(duì)應(yīng)包含目標(biāo)的概率,再利用框回歸修正得到建議框。通過(guò)非極大值抑制算法(Non-maximum suppression,NMS)根據(jù)分類的得分對(duì)這些建議框進(jìn)行排序,得分較高的建議框作為ROI 輸出。將每個(gè)ROI 分塊最大池化以統(tǒng)一區(qū)域特征的大小,通過(guò)全連接層后由Softmax 層計(jì)算每個(gè)目標(biāo)建議框識(shí)別為目標(biāo)的概率;同時(shí)利用邊界框回歸對(duì)目標(biāo)建議框進(jìn)行精確微調(diào),輸出檢測(cè)結(jié)果。
一方面,F(xiàn)aster R-CNN 模型作為基于CNN 的目標(biāo)檢測(cè)方法,在提出區(qū)域建議的思想下利用RPN的設(shè)計(jì)大大提高了模型的效率,尤其在醫(yī)學(xué)領(lǐng)域的應(yīng)用中有著實(shí)用意義。另一方面,自然場(chǎng)景下的模型方法也常應(yīng)用于醫(yī)學(xué)圖像以診斷各類疾病,說(shuō)明醫(yī)學(xué)圖像中的特征能夠通過(guò)模型進(jìn)行較為充分的提取。綜上,本文采取Faster R-CNN 檢測(cè)模型作為診斷方法的基礎(chǔ)。
本節(jié)設(shè)計(jì)代價(jià)敏感的Faster R-CNN 方法,說(shuō)明其中改進(jìn)方法細(xì)節(jié)處理,以及如何基于此方法實(shí)現(xiàn)對(duì)腦出血的智能診斷,圖1 展示了模型的結(jié)構(gòu)。
圖1 用于腦出血檢測(cè)的代價(jià)敏感Faster R-CNN 模型結(jié)構(gòu)Fig.1 Architecture of cost-sensitive Faster R-CNN for the detection of ICH
在模型的RPN 層中錨的設(shè)計(jì)是檢測(cè)的基礎(chǔ)。以一個(gè)點(diǎn)為中心,基于3 種不同的長(zhǎng)寬比和3 種不同的尺度,共有9 種組合方式對(duì)應(yīng)生成9 個(gè)尺寸的錨,而長(zhǎng)寬比和縮放尺度的適當(dāng)選取,將對(duì)檢測(cè)效果和框定區(qū)域準(zhǔn)確度的提高有所幫助。
考慮到實(shí)際CT 圖像中的腦出血區(qū)域形態(tài)各異,長(zhǎng)寬比上有很大的不同,尺度上也有較大差異,因此在訓(xùn)練集上提取所有標(biāo)注框的長(zhǎng)寬比和面積值,分別對(duì)這兩個(gè)方面進(jìn)行聚類,通過(guò)K-means 方法在每個(gè)方面分別得到3 個(gè)聚類中心,即最終通過(guò)3 種長(zhǎng)寬比和3 個(gè)面積值形成針對(duì)腦出血區(qū)域尺寸特點(diǎn)的9 種錨。
訓(xùn)練RPN 網(wǎng)絡(luò)時(shí),通過(guò)錨生成機(jī)制得到的多個(gè)錨將與真實(shí)圖像中的標(biāo)記框做交并比(Intersection-over-union,IoU)計(jì)算,如果IoU>0.7 則認(rèn)為當(dāng)前錨為前景樣本,即RPN 網(wǎng)絡(luò)訓(xùn)練中的陽(yáng)性樣本,如果IoU<0.3 則認(rèn)為當(dāng)前錨為背景樣本,即陰性樣本,對(duì)初篩出的樣本進(jìn)行NMS 算法篩選,得到實(shí)際訓(xùn)練需要的N個(gè)樣本。初始兩類樣本比例設(shè)為1∶1,即在一張圖像中隨機(jī)抽取的陽(yáng)性樣本和陰性樣本數(shù)量相同。
考慮到問(wèn)題的代價(jià)敏感性,更多的陽(yáng)性樣本有利于訓(xùn)練模型識(shí)別目標(biāo)出血區(qū)域并減少漏檢的能力。因此在訓(xùn)練集中考慮適當(dāng)提高陽(yáng)性樣本的比例,并且希望根據(jù)模型當(dāng)前檢測(cè)能力自動(dòng)在一定區(qū)間范圍內(nèi)調(diào)整比例。設(shè)當(dāng)前圖像陽(yáng)性樣本數(shù)Nif和陰性樣本數(shù)Nib表達(dá)式分別為
式中:i為當(dāng)前圖像索引;ki為此圖像中陽(yáng)性樣本與陰性樣本的比值,且1 ≤ki≤R,R≥1;N為一張圖像中總樣本數(shù)。其中ki的更新策略為
式中:j為當(dāng)前圖像中所有錨樣本的索引;pij表示錨預(yù)測(cè)為目標(biāo)的概率;表示實(shí)際標(biāo)簽,當(dāng)樣本為陽(yáng)性樣本時(shí)取1,否則為0。通過(guò)自動(dòng)化更新錨樣本比例的策略,使得模型在訓(xùn)練時(shí)能夠根據(jù)在陽(yáng)性樣本上的訓(xùn)練情況選擇接下來(lái)是否提高陽(yáng)性樣本的占比。
代價(jià)敏感問(wèn)題希望盡可能減少圖形中的漏檢情況,因此考慮在模型的損失函數(shù)中設(shè)計(jì)代價(jià)敏感損失,以增加對(duì)于模型未識(shí)別出陽(yáng)性樣本情況的懲罰。
Faster R-CNN 模型整體包括兩大類損失,分別是RPN 部分產(chǎn)生的RPN 損失和分類回歸部分產(chǎn)生的損失稱為RCNN 損失,這兩個(gè)損失中又分別包括分類損失和回歸損失。分類損失由交叉熵來(lái)實(shí)現(xiàn),表達(dá)式為
式中:tij表示錨預(yù)測(cè)的框偏移量;表示錨實(shí)際的偏移量。
RPN 層的分類損失是針對(duì)樣本是否是目標(biāo)產(chǎn)生的,而RCNN 損失中的分類損失是考慮檢測(cè)到的目標(biāo)屬于哪一類,因此考慮對(duì)前者損失函數(shù)進(jìn)行改進(jìn)。通過(guò)引入超參數(shù)α,提高模型對(duì)陽(yáng)性樣本的關(guān)注,增加陽(yáng)性樣本漏檢帶來(lái)的損失,改進(jìn)后的RPN 層分類損失函數(shù)為,表達(dá)式為
選取不同的超參數(shù)α的值,通過(guò)最小化相應(yīng)的具有代價(jià)敏感設(shè)計(jì)的損失函數(shù),訓(xùn)練針對(duì)醫(yī)學(xué)圖像檢測(cè)模型,考察模型在預(yù)留出來(lái)的驗(yàn)證集上的結(jié)果,進(jìn)行網(wǎng)格搜索選取合適的α值,得到最終的代價(jià)敏感Faster R-CNN 模型,后續(xù)在此α值上進(jìn)行進(jìn)一步的出血診斷。
利用有真實(shí)框標(biāo)記的腦出血數(shù)據(jù)集訓(xùn)練代價(jià)敏感的Faster R-CNN 檢測(cè)模型,降低模型的損失使其收斂以提高模型性能。輸入顱腦CT 圖像,識(shí)別其中是否存在出血區(qū)域,檢測(cè)框可以定位到可能的出血,并給出其概率。選擇一個(gè)接受閾值θ,若檢測(cè)框的概率高于閾值,則決定認(rèn)為框識(shí)別到了出血,在一張圖像中最終確定了一個(gè)或多個(gè)標(biāo)記框,即模型識(shí)別到了一處或多處出血,則此CT 圖像分為陽(yáng)性的一類,否則為正常即陰性的一類,因此該CT 圖像診斷結(jié)果Ytest表達(dá)式為
式中:yl代表圖像檢測(cè)結(jié)果中第l個(gè)檢測(cè)框概率;θ為接受閾值水平。
在模型給出診斷結(jié)果時(shí),可以了解出血的具體位置和形態(tài),同時(shí)對(duì)于在不平衡代價(jià)下更關(guān)注漏檢情況的模型,給出模型的感興趣區(qū)域能夠快速識(shí)別其中的假陽(yáng)性。
本節(jié)使用代價(jià)敏感的Faster R-CNN 模型,在實(shí)際采集的含有腦出血的CT 影像數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),相關(guān)的實(shí)驗(yàn)環(huán)境為Ubuntu16.04LTS 操作系統(tǒng),GPU 型號(hào)為NVIDIA GeForce GTX Titan X,使用深度學(xué)習(xí)框架Tensorflow1.10.0。
本文CT 圖像數(shù)據(jù)來(lái)自南京鼓樓醫(yī)院醫(yī)學(xué)影像科,使用的CT 掃描儀廠商是飛利浦,掃描得到的圖像大小為512 像素×512 像素,層厚6 mm,層距6 mm。收集了100 個(gè)腦出血病人的顱腦非增強(qiáng)CT 斷層圖像進(jìn)行研究,每個(gè)病例由高年資??漆t(yī)師篩選出較有意義的16 張圖像。對(duì)于每張圖像首先使用MicroDicom 軟件[17]讀取DICOM 格式,根據(jù)相關(guān)研究[18]以及專家經(jīng)驗(yàn)和建議選取窗位WL為50,窗寬WW為100,在這個(gè)水平下將DICOM 轉(zhuǎn)換為日常通用的PNG 圖像格式以便后續(xù)處理。然后由專家對(duì)此1 600 張圖像做數(shù)據(jù)標(biāo)注,通過(guò)LabelImg 軟件[19]對(duì)圖像中的腦出血區(qū)域添加標(biāo)記框,根據(jù)PASCAL VOC數(shù)據(jù)集格式寫成XML 文件。關(guān)于數(shù)據(jù)集的制作,將全部1 600 張圖像隨機(jī)抽取50%作為訓(xùn)練集,20%作為驗(yàn)證集以及30%作為測(cè)試集,具體如表1 所示。由于樣本量相對(duì)較小,因此對(duì)訓(xùn)練集的部分進(jìn)行數(shù)據(jù)擴(kuò)充,通過(guò)平移和放縮的方式將樣本擴(kuò)充至原來(lái)的4 倍。
表1 數(shù)據(jù)集劃分Table 1 Partition of dataset
對(duì)于本文使用的模型來(lái)說(shuō),數(shù)據(jù)集的規(guī)模較小,因此考慮應(yīng)用預(yù)訓(xùn)練模型,加快收斂速度并有效提高性能。對(duì)于自然場(chǎng)景下的Faster R-CNN 模型來(lái)說(shuō),大型數(shù)據(jù)集ImageNet 已經(jīng)被用于模型的預(yù)訓(xùn)練,同時(shí)Dawud 等[4]通過(guò)研究和對(duì)比試驗(yàn)說(shuō)明了自然圖像到醫(yī)學(xué)圖像的知識(shí)轉(zhuǎn)移是可能且有用的,故預(yù)訓(xùn)練后的模型也可以應(yīng)用于本文問(wèn)題的研究。實(shí)驗(yàn)中分別選取VGG16、ResNet50、Inception V3 三種特征提取網(wǎng)絡(luò),以選取在本問(wèn)題中更為合適的網(wǎng)絡(luò)。在RPN 中,每張圖像選取中選取共256 個(gè)錨樣本用于訓(xùn)練,初始選取相同數(shù)量的前景和背景樣本分別作為檢測(cè)過(guò)程中的陽(yáng)性樣本和陰性樣本。學(xué)習(xí)率預(yù)先設(shè)置為0.000 5,迭代次數(shù)為30 000,其中15 000 次迭代后,學(xué)習(xí)率降為0.000 1,使用隨機(jī)梯度下降的動(dòng)量方法進(jìn)行訓(xùn)練,動(dòng)量值為0.9。
本文基于VGG16、ResNet50、Inception V3 三種特征提取網(wǎng)絡(luò)進(jìn)行實(shí)驗(yàn),并對(duì)比了有無(wú)數(shù)據(jù)擴(kuò)充和基于聚類的錨生成機(jī)制對(duì)檢測(cè)結(jié)果的影響,多次實(shí)驗(yàn)的mAP 平均水平統(tǒng)計(jì)情況如圖2 所示。通過(guò)對(duì)比可以發(fā)現(xiàn),針對(duì)本檢測(cè)問(wèn)題表現(xiàn)效果更好的是ResNet50 網(wǎng)絡(luò),后續(xù)實(shí)驗(yàn)基于此網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行。同時(shí)結(jié)果表明,進(jìn)行了數(shù)據(jù)擴(kuò)充處理和基于聚類方法生成錨后,在3 種網(wǎng)絡(luò)結(jié)構(gòu)上均表現(xiàn)出了mAP 水平提升,說(shuō)明兩種方法處理的有效性。
圖2 不同網(wǎng)絡(luò)下的Faster R-CNN 不同方法處理的mAP 檢測(cè)指標(biāo)結(jié)果Fig.2 Results of mAP with different methods of Faster R-CNN under different networks
通過(guò)實(shí)驗(yàn)固定了特征提取的網(wǎng)絡(luò)結(jié)構(gòu)后,考察代價(jià)敏感Faster R-CNN 方法的檢測(cè)效果,其中為特定損失中的超參數(shù)α取不同的值,其對(duì)應(yīng)的mAP 指標(biāo)變化以及與非代價(jià)敏感設(shè)計(jì)方法的結(jié)果對(duì)比如圖3 所示。從圖中可以發(fā)現(xiàn),隨著α取值的不同,代價(jià)敏感方法的檢測(cè)效果也不同,并且整體水平要高于原模型。其中在α=100 時(shí)驗(yàn)證集上表現(xiàn)最好。整體表現(xiàn)說(shuō)明代價(jià)敏感設(shè)計(jì)使得整體模型能夠在識(shí)別腦出血區(qū)域時(shí)更關(guān)注漏檢,通過(guò)對(duì)出血區(qū)域更敏感的角度提高檢測(cè)能力。
圖3 不同超參數(shù)α 下代價(jià)敏感模型與原模型在mAP 指標(biāo)上的結(jié)果對(duì)比Fig.3 Performance comparison between cost-sensitive method and baseline on mAP based on different α
選擇超參α為100 在測(cè)試集上進(jìn)行出血區(qū)域的識(shí)別,進(jìn)而依據(jù)檢測(cè)的結(jié)果給出基于圖像級(jí)別的出血診斷,與原始Faster R-CNN 以及其他依賴于深度學(xué)習(xí)的診斷方法結(jié)果進(jìn)行比較。Phong 等[20]在研究中對(duì)比了LeNet、GoogLeNet 和Inception ResNet 三種深度學(xué)習(xí)架構(gòu)在腦出血診斷的效果,證明了LeNet 在精度和時(shí)間上都要優(yōu)于后兩者。同時(shí)Dawud 等[4]和Togacar等[5]在關(guān)于腦出血診斷的研究中均使用了AlexNet,并取得了很好的結(jié)果。Menon 等[8]針對(duì)腦出血檢測(cè)任務(wù)中利用DenseNet 模型進(jìn)行研究,并對(duì)相對(duì)較小的出血進(jìn)行關(guān)注,取得良好的效果。而Mushtaq 等[11]在研究中利用CNN 構(gòu)建了BHCNet 模型,基于CT 掃描對(duì)腦出血進(jìn)行分類,通過(guò)關(guān)注小的不平衡數(shù)據(jù)集,使模型具有良好的識(shí)別能力。因此本文選用LeNet、AlexNet、DenseNet 和BHCNet 與基于原Faster R-CNN的診斷方法進(jìn)行對(duì)比實(shí)驗(yàn),在準(zhǔn)確率、召回率和精度這3 種分類指標(biāo)下的結(jié)果如圖4 所示。
圖4 不同檢測(cè)框概率閾值下不同模型與代價(jià)敏感方法的腦出血診斷結(jié)果對(duì)比Fig.4 Comparison of ICH diagnosis results between different models and cost sensitive method with different probability thresholds of bounding box
對(duì)于依據(jù)檢測(cè)框的診斷來(lái)說(shuō),當(dāng)閾值選擇越大,被判定為出血區(qū)域越嚴(yán)格,而當(dāng)閾值選擇越小,概率相對(duì)來(lái)說(shuō)較低的區(qū)域容易被判定為出血,因此閾值的選擇會(huì)對(duì)最終的結(jié)果有影響。從圖4 中可以發(fā)現(xiàn),整體上代價(jià)敏感的方法效果優(yōu)于以普通Faster R-CNN 實(shí)現(xiàn)的診斷模型、AlexNet 模型、LeNet 模型以及DenseNet 模型。在分類精度方面,可以發(fā)現(xiàn)BHCNet 模型與本文提出方法均有很好的表現(xiàn)。而從閾值對(duì)改進(jìn)前后的模型在結(jié)果上的影響來(lái)看,通過(guò)更多關(guān)注漏檢的情況,本文提出方法可以在更小的犧牲準(zhǔn)確率的同時(shí)達(dá)到更高的召回率??梢?jiàn)在選取合適的閾值水平下,代價(jià)敏感的Faster R-CNN 方法具有召回率方面的優(yōu)勢(shì)。實(shí)驗(yàn)中,本文提出的模型在閾值選取為0.85 時(shí)表現(xiàn)最好,陽(yáng)性病例分類的準(zhǔn)確率為0.90,召回率為0.91,分類精度為0.92。
圖5 顯示了實(shí)驗(yàn)中具體實(shí)例的出血區(qū)域檢測(cè)結(jié)果,以及基于0.85 的檢測(cè)框概率閾值的腦出血情況診斷。其中陽(yáng)性樣本為1、2、7、8,陰性樣本為3、4、5、6,從圖中可以看出,在0.85 的閾值下,1 和2 分別以1.000 和0.995 的檢測(cè)框概率得到真陽(yáng)性(TP)的診斷結(jié)果,3 和4 分別以0.224 和0.000 的檢測(cè)框概率得到假陽(yáng)性(FP)的診斷結(jié)果,5 和6 分別以1.000 和0.856 的檢測(cè)框概率得到真陰性(TN)的診斷結(jié)果,7 和8 分別以0.778 和0.820 的檢測(cè)框概率得到假陰性(FN)的診斷結(jié)果。
圖5 閾值0.85 水平下檢測(cè)和診斷結(jié)果示例Fig.5 Examples of detection and diagnosis results at the threshold level of 0.85
為了使醫(yī)學(xué)圖像的智能診斷在臨床上實(shí)現(xiàn)更好的應(yīng)用,需要考慮疾病漏檢情況的嚴(yán)重性并盡量減少漏檢情況的發(fā)生,同時(shí)關(guān)心基于深度學(xué)習(xí)的模型方法所得結(jié)果的可信度和可視化問(wèn)題。為此本文提出了基于腦CT 影像識(shí)別和診斷腦出血疾病的代價(jià)敏感Faster R-CNN 模型,該方法能夠在腦出血診斷中快速定位到圖像中的出血區(qū)域,能夠更好地使診斷的依據(jù)一目了然,更方便醫(yī)生進(jìn)行基于此結(jié)果的細(xì)節(jié)檢查,提高醫(yī)生的工作效率。實(shí)驗(yàn)結(jié)果表明,相較于原本的檢測(cè)模型和CNN 直接用于分類的方法,代價(jià)敏感的Faster R-CNN 可以取得更好的效果,降低漏檢的可能,具有一定的研究?jī)r(jià)值和現(xiàn)實(shí)意義。