曹源 王妍 王文強 賀小偉
摘要:由于擁有像素級標記的醫(yī)學圖像數(shù)量非常少,制約了卷積神經(jīng)網(wǎng)絡(luò)在醫(yī)學圖像分割任務(wù)上的應(yīng)用,因此,該文提出了一種基于委員會查詢的自步多樣性學習算法,在訓練數(shù)據(jù)有限的情況下提升醫(yī)學圖像分割模型的性能。該文所提算法結(jié)合了基于委員會查詢的數(shù)據(jù)選擇方法,實現(xiàn)動態(tài)地從易到難選擇樣本,對模型進行訓練。同時,該算法通過應(yīng)用仿射傳播聚類,保證了數(shù)據(jù)選擇的多樣性,提升了圖像分割模型的性能。為了驗證所提算法框架的有效性,分別在3類醫(yī)學圖像分割任務(wù)的5個不同數(shù)據(jù)集任務(wù)上進行了實驗,實驗結(jié)果表明,該文所提算法可以顯著提升分割性能。在使用相同數(shù)據(jù)的訓練的情況下,相比于全監(jiān)督學習,使用該文算法可以得到更高的Dice評估指標、表面距離和平均交并比值。
關(guān)鍵詞:自步多樣性學習;圖像分割;委員會查詢;深度學習
中圖分類號:TP3-05
DOI:10.16152/j.cnki.xdxbzr.2020-02-016
Self-paced learning with diversity for medical image segmentationby using query-by-committee
CAO Yuan1,2,WANG Yan3, WANG Wenqiang1,2, HE Xiaowei1,2
Abstract: Because ?the number of pixel-wise labeled medical images are extremely small, which prevents the application of convolutional neural network (CNN) in medical image segmentation tasks,? a query-by-committee based self-paced learning with diversity (SPLD) framework is proposed to boost the performance of medical image segmentation with limited data. The proposed SPLD algorithm combines the data selection method based the query-by-committee to realize the dynamic selection of samples from easy to difficult and train the model. Meanwhile, by applying the affine propagation clustering, the proposed algorithm guarantees the diversity of data and the? performance of image segmentation model is further enhanced. To verify the effectiveness of the proposed QBC based SPLD framework, we conducted experiments on three medical image segmentation tasks with five different datasets. The experimental results show that the proposed algorithm can significantly improve the segmentation performance.With the same dataset,? the proposed SPLD could significantly improve the segmentation performance and achieve a higher Dice score, surface distance and mean Intersection over Union (mIoU) than fully supervised learning.
Key words: self-paced diversity learning; image segmentation; query by committee; deep learning
醫(yī)學圖像分割結(jié)果的精度對醫(yī)生的診斷結(jié)果有著關(guān)鍵影響。近年來,基于深度學習的圖像分割技術(shù)成為醫(yī)學圖像語義分割領(lǐng)域中最流行的方法,并已經(jīng)應(yīng)用到了視網(wǎng)膜血管分割[1]、器官分割[2]和細胞分割[3]等任務(wù)中。由于深度神經(jīng)網(wǎng)絡(luò)的訓練和驗證需要大量的圖像數(shù)據(jù),深度學習往往需要臨床專家進行大量的標注,在這種情況下,有必要充分利用醫(yī)學數(shù)據(jù)背后的信息,為臨床使用提供可靠的結(jié)果。
深度學習中使用的優(yōu)化函數(shù)大多是非凸函數(shù)[4],這也增加了尋找全局最優(yōu)解的難度。自步學習 (self-paced learning, SPL)[5]是一種流行的訓練策略,SPL可以模擬人類的學習過程,它通過先輸入簡單的樣本,后輸入復雜的樣本,來挖掘訓練數(shù)據(jù)背后的信息,從而提高模型性能[6]。但是,數(shù)據(jù)的復雜程度是未知的,在自步學習算法設(shè)計中,需要從計算機的角度,實現(xiàn)對數(shù)據(jù)難易程度的判定。
根據(jù)文獻[7]所述,數(shù)據(jù)集背后的概率分布很難獲得,如果直接將SPL學習框架應(yīng)用到圖像分割任務(wù)中,SPL模型將選擇同一概率分布簇中的圖像,使模型的權(quán)值優(yōu)化到局部最小解[8]。而從不同概率分布中選擇訓練數(shù)據(jù),可以提高訓練結(jié)果的泛化性能,從而防止模型優(yōu)化到局部最優(yōu)解。在Jiang等人通過將數(shù)據(jù)多樣性引入到SPL學習策略中,提出了基于多樣性的自步學習策略(self-paced learning with diversity, SPLD),實現(xiàn)了在自步學習過程中保證數(shù)據(jù)的多樣性,并應(yīng)用到了稀疏型分類任務(wù)中[8]。但是,該算法無法直接應(yīng)用到稠密型分類任務(wù)中,如圖像分割任務(wù)。
本文提出了一種通用的醫(yī)學圖像分割的自步學習框架。與傳統(tǒng)的自步學習方法不同的是,本文所提方法不使用圖像分類結(jié)果的準確性來確定樣本的復雜程度,而是使用委員會查詢(QBC)[9]技術(shù)來確定SPL學習過程中樣本的難易程度。我們將該框架命名為基于委員會查詢的自步多樣性學習(SPLD-QBC),委員會中的一個成員是一個基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)的深度分割網(wǎng)絡(luò),每個成員都使用相同的數(shù)據(jù)集進行訓練。在SPLD-QBC學習框架下,數(shù)據(jù)的復雜程度和多樣性取決于每個成員之間的深層特征,均由所有成員提取的特征向量的余弦相似度進行計算。
圖1顯示了本文所提出的SPLD-QBC框架應(yīng)用在視網(wǎng)膜血管分割任務(wù)上的流程。SPLD-QBC框架中,委員會中的每個成員為一個具有相同結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò),在每個成員中選取一個特定的特征圖,對其進行全局平均池化后,即得到輸入數(shù)據(jù)的特征向量。SPLD-QBC框架通過提取的特征向量實現(xiàn)對樣本難易程度和多樣性的定義。
本文的主要研究內(nèi)容如下:
1)設(shè)計了一種結(jié)合SPLD和QBC學習機制的通用醫(yī)學圖像語義分割框架,提高了分割模型的性能。
2)將SPLD-QBC應(yīng)用于5個數(shù)據(jù)集的3個醫(yī)學圖像分割任務(wù)。實驗結(jié)果表明,SPLD-QBC框架可以顯著提高模型性能。
3)從實驗和理論上證明了SPLD-QBC的有效性,論證了模型的泛化能力。
1 相關(guān)工作
1.1 自步學習
SPL算法將課程學習(Curriculum learning)嵌入到學習目標函數(shù)中,并添加正則項,從而組成學習的目標函數(shù)[10]。SPL算法可以同時優(yōu)化模型參數(shù)w和權(quán)重v=[v1,v2,…,vn]T,其中,v表示每個樣本選擇的權(quán)重。SPL的目標函數(shù)如下:
其中,λ表示學習速度;f表示機器學習模型;L表示損失函數(shù);xi和yi表示訓練數(shù)據(jù)及其對應(yīng)的標簽。
從理論角度來看,SPL已經(jīng)擴展到自步課程學習[10]、自步強化學習[11]以及自步集成學習[12]。在SPL的擴展中,在式(1)中加入了幾個正則項來進行具體任務(wù)的優(yōu)化。從應(yīng)用的角度看,SPL已經(jīng)在分類[13]、人臉重新識別[14]和矩陣分解[15]中得到了應(yīng)用。大多數(shù)基于SPL的應(yīng)用是在稀疏標簽分類數(shù)據(jù)上實現(xiàn)的,即每個數(shù)據(jù)的標簽為單一的標量。但是,目前還沒有研究將SPL應(yīng)用于密集的標簽分類數(shù)據(jù),例如醫(yī)學圖像語義分割任務(wù),即標簽為每個像素點的類別。
1.2 自步多樣性學習
SPLD通過嵌入一個與特定模型優(yōu)化目標無關(guān)的正則化項來確定訓練數(shù)據(jù)的多樣性。SPLD學習框架考慮了數(shù)據(jù)的多樣性和數(shù)據(jù)難易程度,并將數(shù)據(jù)依次輸入模型進行訓練,以保證更好的模型性能。SPLD的修改是在式(1)中加入正則化項,形成多樣性約束。目標函數(shù)如式(2)所示:
其中,γ是新添加的控制數(shù)據(jù)多樣性的超參數(shù)。SPLD首先被用在了基于隨機森林[16]和支持向量機(SVM)的動作識別任務(wù)和多媒體事件檢測中。兩個任務(wù)中使用的數(shù)據(jù)集都是稀疏標簽數(shù)據(jù)集,每個數(shù)據(jù)所屬的類在SPLD模型中都是已知的。然而,在醫(yī)學圖像語義分割任務(wù)中,圖像級標簽即分類標簽是未知的。因此,在醫(yī)學圖像分割任務(wù)中,無法利用預先獲得的類別標簽來控制數(shù)據(jù)多樣性。
1.3 委員會查詢
委員會查詢(query-by-committee, QBC)是一種主動學習算法。在QBC中,使用相同的數(shù)據(jù)對委員會中的每個成員進行訓練,之后每個成員對數(shù)據(jù)進行投票,根據(jù)投票結(jié)果的一致性決定數(shù)據(jù)是否要加入到訓練集:如果投票結(jié)果相似,說明樣本較為容易;相反,如果投票結(jié)果相差較大,說明樣本較為復雜。因此,基于QBC的主動學習可以有效地評估訓練數(shù)據(jù)的難易程度。在QBC中,交叉熵常用于計算數(shù)據(jù)的相似度[17],然而,熵一直是基于稀疏標簽預測的,不適合用于稠密標簽分類任務(wù),因此,需要對其進行改進。
2方 法
2.1 自步學習正則項
在說明算法之前,我們首先給出變量的定義。 令Labeled Data={{x1,y1},{x2,y2},…,{xn,yn}}是從包含有n個分割金標準的醫(yī)學圖像中裁剪的圖像塊的集合。令C={θ θ …,θG}
為包含有|C|個成員的委員會,且每個成員θi都是用于醫(yī)學圖像語義分割的CNN。本文的方法利用QBC框架,在每次迭代中,每個委員會中的成員都會計算輸入數(shù)據(jù)的特征。
基于CNN的圖像分割網(wǎng)絡(luò)通常包含一個編碼器和一個解碼器。在SPLD-QBC中,從編碼器的最后一層提取特征圖,并使用全局平均池化(global average pooling, GAP)層將特征圖轉(zhuǎn)換為特征向量。委員會中的每個成員都生成代表輸入圖像特征的特征向量,并將從θi中生成的特征向量定義為Fi。兩個成員之間的相似性是通過余弦距離來衡量的,如式(3)所示:
其中,|Fi|表示委員會C中成員θi提取的高級特征向量的長度,每個成員之間的相似性可以表述為
本文將輸入數(shù)據(jù)xk在委員會之間的特征相似性定義為
SPLD-QBC框架背后的假設(shè)是,如果提取的特征向量之間的相似性較高,則表明委員會中的所有成員都已充分學習了輸入數(shù)據(jù)xk。因此,如果成員之間的特征向量具有較高的相似度,說明該樣本是“簡單”樣本,SPL訓練過程中首先會將其輸入到模型中進行訓練。相反,樣本之間相似性較小則意味著從每個成員中所生成的特征具有極大的差異,這表明當前模型難以學習該樣本。在獲得所有訓練樣本的相似性之后,將它們歸一化為[0,1],以形成式(1)中的SPL正則項。歸一化方法為
為了在訓練過程中應(yīng)用SPL策略,需要解決以下3個問題:
1)在初始訓練時期應(yīng)選擇多少數(shù)據(jù)?SPL策略必須首先利用少量數(shù)據(jù)提供的信息訓練模型中的參數(shù),然后, 將更多帶標簽的數(shù)據(jù)添加到訓練集中, 以控制樣本的選擇和學習的步長。 但是, 在初始的迭代過程中, CNN尚未收斂。 如果將數(shù)據(jù)選擇規(guī)則直接應(yīng)用于SPL策略, 那么該模型可能會崩潰, 導致SPL框架無法正常工作。? 為了解決這個問題, 我們隨機選擇少量訓練樣本來訓練模型。 例如, 可以隨機抽取10%的樣本用來訓練委員會中的每個成員, 對CNN中的參數(shù)進行預熱。 訓練數(shù)據(jù)的初始比率在本文的算法中定義成名為ITDR的超參數(shù)。如果模型收斂,則使用式(6)控制學習速率以及選擇樣本的權(quán)重。
2)基于QBC學習的另一個問題是,所有成員都具有相同的CNN架構(gòu)。這表示如果它們的參數(shù)相同,當輸入相同時,輸出的特征向量也是相同的,從而造成QBC算法失效。為了克服這一缺點,我們在每個CNN中使用不同的種子隨機初始化模型權(quán)重。由于使用了不同的種子,每個成員中的參數(shù)隨之也會不同,這使得它們可以有效地確定數(shù)據(jù)的相似性。此外,在訓練過程中,將針對不同的解決方案優(yōu)化參數(shù)。
3)如何控制學習速度?在實踐中,我們需要防止SPL學習器貪婪地添加數(shù)據(jù),即防止其將每個數(shù)據(jù)的vk設(shè)置為1。如果SPL學習器在每個訓練結(jié)束后添加固定數(shù)量的訓練數(shù)據(jù),則所有數(shù)據(jù)將被添加到訓練集中,所提出的方法將退化為全監(jiān)督學習(fully supervised learning, FSL)方法。為了解決這個問題,在不確定性采樣策略的啟發(fā)之下[18],通過設(shè)置不確定性閾值來對查詢規(guī)則施加限制。該閾值在本文算法中稱為UT。當且僅當委員會中所有成員評估數(shù)據(jù)的vk值大于閾值UT時,SPL學習器才將樣本定義為“簡單”樣本,在下一次的迭代訓練過程中將數(shù)據(jù)添加到訓練集中對模型進行優(yōu)化。
此外,在訓練過程中會動態(tài)更改UT。在第一個訓練迭代過程中,UT等于v中最大vk的0.9倍。隨著訓練迭代次數(shù)的增加,UT根據(jù)式(7)動態(tài)變化,
其中,e表示當前訓練迭代的次數(shù);m表示總訓練迭代次數(shù)。
2.2 基于聚類的數(shù)據(jù)多樣性
直觀地,從不同類別中選擇訓練數(shù)據(jù)是一種在模型訓練期間保持數(shù)據(jù)多樣性的方法,且這種方法易于實現(xiàn)。但是,用于分割的醫(yī)學圖像通常缺少分類標簽,在這種情況下,本文使用聚類算法實現(xiàn)對數(shù)據(jù)的分組。在確定數(shù)據(jù)難以程度時,使用了每個成員提取的特征向量,同理,在數(shù)據(jù)分組階段,還可以使用提取的特征向量進行聚類。
在委員會中,對于每個訓練數(shù)據(jù),模型都會生成|C|特征向量。我們使用|C|的平均值特征作為樣本的特征向量,如式(8)所示:
但是,使用聚類算法實現(xiàn)數(shù)據(jù)分組的過程中,最優(yōu)的分組個數(shù)無法確定,如果聚類數(shù)太大,則所有數(shù)據(jù)將被單獨分組到一個中心,且每個中心的樣本數(shù)量很少;相反,如果聚類數(shù)過少,則不能有效地表示多樣性。為了解決這個問題,我們使用仿射傳播算法[19]對生成的特征向量進行聚類。放射變換算法在聚類初始情況下不需要確定聚類的類別數(shù),聚類的過程中根據(jù)樣本的分布特性來確定類別的簇,從而動態(tài)地根據(jù)樣本特征進行聚類。
在每個訓練時期,將仿射傳播算法應(yīng)用于特征提取并將數(shù)據(jù)聚類到不同的聚類類別中。之后,應(yīng)用SPL方法從每個聚類組中選擇模型認為較為簡單的樣本。為了保證訓練樣本的多樣性,SPL學習器從每個組中選擇最簡單的樣本,并且相應(yīng)的數(shù)據(jù)權(quán)重變量變?yōu)関=[v v …,vg],且vi=[vi1,vi2,…,vig(i)],s.t.i∈[1,g],g(i)表示第i組中數(shù)據(jù)樣本的個數(shù)。
通過應(yīng)用分組策略,SPLD的損失函數(shù)從式(2)變?yōu)槭剑?):
綜上所述,本文提出的基于委員會查詢的自步多樣性學習算法步驟如下。
Step 1隨機從數(shù)據(jù)集Labeled Data中選擇ITDR的數(shù)據(jù)。
當模型尚未收斂:
Step 2 使用式(2)中的損失函數(shù)訓練委員會C中的每個成員;
for e=1 to m:
Step 3 根據(jù)式(8)提取每個數(shù)據(jù)的特征向量u,并使用仿射傳播算法對數(shù)據(jù)聚類為g類;
for j in 1 to g:
Step 4 根據(jù)式(6)在第j組中計算樣本的vj;
Step 5 在第j組所有樣本中選擇vjg(i)> UT的樣本,并使用式(9)作為損失函數(shù)對模型進行訓練;
Step 6 使用式(7)更新UT。
3 實 驗
為了證明本文所提SPLD-QBC學習框架的有效性,在5個不同的數(shù)據(jù)集上進行3種類型的醫(yī)學圖像語義分割任務(wù),包括視網(wǎng)膜血管分割、肺部器官語義分割和核醫(yī)學圖像中的細胞分割。
3.1 實現(xiàn)細節(jié)
本文實驗是基于TensorFlow深度學習庫來完成的。為了應(yīng)用自步學習框架,使用了從原始醫(yī)學圖像中裁剪的128×128分辨率的塊圖像進行模型訓練。在測試階段,每個成員的卷積神經(jīng)網(wǎng)絡(luò)模型推斷的是整個分割結(jié)果而不是圖像塊的分割結(jié)果。由于硬件限制,在自步多樣性學習算法中,委員會中成員的數(shù)量設(shè)置為2,3和4。受文獻[20]的啟發(fā),學習率在訓練中動態(tài)調(diào)整為初始學習率的(1-em)0.9倍,其中,e表示當前的訓練的迭代次數(shù),m表示總的訓練迭代次數(shù)。在視網(wǎng)膜血管分割任務(wù)中m=1 000,肺器官分割中m=500,核細胞分割中m=300;ITDR設(shè)置為10%;超參數(shù)λ和γ二者均設(shè)為1。
此外,委員會成員的網(wǎng)絡(luò)設(shè)計針對特定的任務(wù)進行了選擇和優(yōu)化,模型的性能除了受到訓練方法的影響,也會受到選擇的神經(jīng)網(wǎng)絡(luò)的限制。因此,在每個實驗中,我們將提出的自步多樣性學習算法與自步學習策略和全監(jiān)督學習策略進行比較,即將全監(jiān)督學習作為對照組。
3.2 視網(wǎng)膜血管分割實驗
視網(wǎng)膜血管分割在眼底圖像視網(wǎng)膜疾病的自動檢測中起著重要的作用。視網(wǎng)膜血管圖像分析為糖尿病視網(wǎng)膜病變、青光眼等疾病的診斷提供了重要信息[21]。DRIVE數(shù)據(jù)集是一個公共數(shù)據(jù)集,由40張565×584大小的眼底圖像組成[22],這些圖像被手動分為一個包含20張圖像的訓練集和一個包含20張圖像的測試集。STARE數(shù)據(jù)集是另一個由20幅605×700大小的眼底圖像組成的公共數(shù)據(jù)集[23],這些圖像被手動分為一個包含10幅圖像的訓練集和一個包含10幅圖像的測試集。因為眼底圖像中血管的形狀、厚度和對比度都各不相同,所以,視網(wǎng)膜血管分割模型需要綜合考慮這些因素。對于血管分割任務(wù),本文采用全分辨率殘差網(wǎng)絡(luò)(FRRN)[24]作為每個成員的架構(gòu)。FRRN融合了不同大小的輸入,提升了模型的多尺度特性。提取FRRN中定義的最后一個全分辨率殘差單元作為每個成員的潛在特征,并利用該特征計算樣本的難易程度和多樣性。
由于視網(wǎng)膜血管分割任務(wù)中每個像素都屬于血管或背景,所以,這是一個二值分類任務(wù)。為了評估模型的性能,計算了分割結(jié)果與真值之間的Dice指標和Hausdorff表面距離(HD)[25]。Dice指標考慮了分割結(jié)果與真值之間的重疊,Dice指數(shù)值越高,表明模型性能越好。HD度量了空間的兩個子集之間的距離,較低的HD意味著該模型更好,評估結(jié)果見表1。
如表1所示,自步多樣性學習算法的訓練策略優(yōu)于自步學習和全監(jiān)督學習方法。通過在一個由4名成員組成的委員會中使用4個FRRN神經(jīng)網(wǎng)絡(luò),我們的自步多樣性學習模型在STARE數(shù)據(jù)集上的Dice系數(shù)為0.852 0,表面距離為44.920;在DRIVE數(shù)據(jù)集上的Dice系數(shù)為0.826 3,表面距離為31.457 6。進一步觀察發(fā)現(xiàn),成員數(shù)越多越有利于模型訓練。
圖2中展示了不同的樣本上的訓練結(jié)果。圖2中的每行代表一個樣本的原始圖像、全監(jiān)督學習算法、自步學習算法、自步多樣性學習算法得到的分割結(jié)果以及相應(yīng)的金標準??梢杂^察發(fā)現(xiàn),相較于自步學習算法和全監(jiān)督學習算法,我們提出的自步多樣性學習算法可以捕捉更多的毛細血管。這說明自步多樣性學習策略訓練的模型由于具有多樣性學習能力,對小目標和大目標都有較高的捕捉能力。圖2中SPLD-QBC分割出更好結(jié)果的區(qū)域使用黃色圓圈進行了標注。
3.3 基于胸部X光片的器官分割
通過胸部X光掃描病人的器官是日常診斷的重要程序之一,同時也是醫(yī)生診斷的重要依據(jù)[26]。然而,由于胸部X光片在形狀、大小和對比度等方面存在較大的差異,肺部器官分割仍是一項具有挑戰(zhàn)性的任務(wù)。
與視網(wǎng)膜血管分割任務(wù)不同,肺器官分割任務(wù)是語義分割,因為模型將每個像素分別預測為左肺、右肺、心臟或背景。本文分別在JSRT數(shù)據(jù)集[27]和Montgomery數(shù)據(jù)集[28]上進行了實驗。JSRT數(shù)據(jù)集包含247個胸部X光片,包括左肺、右肺、心臟和背景4個類別。而Montgomery的數(shù)據(jù)集包含138張胸透,包括左肺、右肺和背景3個類別。在保證器官結(jié)構(gòu)細節(jié)的前提下,將所有的圖像縮放為256*256大小。在實驗中,隨機選擇80%的樣本進行訓練,其余20%用來測試。
由于器官分割任務(wù)中像素分類的類別大于2,所以它是一種語義分割任務(wù)。實驗使用AdapNet[29]作為每個成員的模型。AdapNet結(jié)合了深度特征融合方法,增加了模型的魯棒性,同時擴大了感受野。將網(wǎng)絡(luò)中第一個反卷積層之前的網(wǎng)絡(luò)層中的特征圖輸入到平均池化層中,轉(zhuǎn)化為特征向量,代表每個成員的深層特征。為了評估模型的性能,計算了分割結(jié)果和金標準的mIoU和HD,mIoU越高,表明模型性能越強,比較結(jié)果如表2所示。
如表2所示,SPLD-QBC模型優(yōu)于SPL和FSL模型。進一步比較發(fā)現(xiàn),本文的方法在HD度量指標上取得了最好的性能,約為FSL模型在Montgomery數(shù)據(jù)集上取得的HD值的一半(40.577 1和22.748 7)。其中,部分分割結(jié)果如圖3所示。對于Montgomery數(shù)據(jù)集,當委員會成員數(shù)量增加時,分割圖中的噪聲量明顯降低。對于JSRT數(shù)據(jù)集,本文提出的SPLD-QBC模型可以對心臟RoI進行精確分割。此外,在兩個數(shù)據(jù)集中使用SPLD-QBC模型進行分割的圖像器官的形狀比使用FSL模型的更完整。圖3中SPLD-QBC分割出更好結(jié)果的區(qū)域使用黃色圓圈進行了標注。
3.4 核素圖像上的細胞分割
核素圖像的分割是數(shù)字病理切片分析的重要任務(wù)之一[30]。臨床實踐中最重要的步驟之一就是從整個圖像(WSIs)中提取信息成分[31]。然而,一個WSI中包含大量的細胞,手工分割費時費力。
將本文提出的模型應(yīng)用于H&E染色的多器官細胞核分割數(shù)據(jù)集[32],其包含30個WSI和對應(yīng)的22 000個細胞邊界。WSIs中的每個像素被分為兩類,一類是細胞核,另一類是背景。我們將每個成員設(shè)置為一個全卷積DenseNet網(wǎng)絡(luò)[33],在這個任務(wù)中,隨機選擇20個樣本作為訓練集,其余的10個樣本作為測試集。每個圖像的分辨率被調(diào)整為1 024×1 024,從一個WSI中裁剪了64個分辨率為128×128的裁剪圖像。與視網(wǎng)膜血管分割任務(wù)相同,使用DSC和HD來評估模型性能,如表3所示。
如表3所示,本文所提出的模型獲得了最佳的mIoU和HD評估指標。不同算法的細胞核部分分割結(jié)果如圖4所示,SPLD-QBC分割出更好的區(qū)域使用黃色圓圈進行了標注。
4 結(jié) 語
本文提出了一種用于醫(yī)學圖像分割的通用醫(yī)學圖像語義分割框架,該方法可以提高醫(yī)學圖像語義分割模型的性能。通過應(yīng)用委員會查詢方法,可以動態(tài)選擇訓練樣本的序列,從而使模型達到更高的模型性能。為了防止模型權(quán)重被優(yōu)化到局部最小值,采用聚類算法來保證數(shù)據(jù)的多樣性,從而使模型參數(shù)被優(yōu)化到全局最小值。實驗結(jié)果表明,本文提出的SPLD-QBC算法可以顯著提高分割模型的性能,并且可以嵌入到基于CNN的分割模型中。
參考文獻:
[1]HU K, ZHANG Z, NIU, et al. Retinal vessel segmentation of color fundus images using multiscale convolutional neural network with an improved cross-entropy loss function [J]. Neurocomputing, 2018, 309:179-191.
[2]DAI W, DONG N, WANG Z, et al. Scan: Structure correcting adversarial network for organ segmentation in chest x-rays [C]∥Deep Learning in Medical Image Analysis and Multimodal Learning for Clinical Decision Support, 2018: 263-273.
[3]ARBELLE A, RAVIV TR. Microscopy cell segmentation via adversarial neural networks [C]∥2018 IEEE 15th International Symposium on Biomedical Imaging. IEEE, 2018:645-648.
[4]BENGIO Y, LOURADOUR J, COLLOBERT R, et al. Curriculum learning [C]∥The 26th Annual International Conference on Machine Learning. ACM,2009:41-48.
[5]KUMAR MP, PACKER B,KOLLER D. Self-paced learning for latent variable models [C]∥Advances in Neural Information Processing Systems. Vancouver:Curran Associates Company,2010:1189-1197.
[6]代建建, 陶洋, 章思青. 基于自步學習的無線傳感網(wǎng)入侵檢測集成算法[J]. 計算機工程與設(shè)計, 2019, 40(5):57-61.
DAI J J, TAO Y, ZHANG S Q. Wireless sensor network intrusion detection integration algorithm based on self-step learning[J]. Computer Engineering and Design,2019,40(5):57-61.
[7]KINGMA D P, WELLING M. Auto-encoding variational bayes [J].Computer Science,2013.
[8]JIANG L, MENG D Y. Self-paced learning with diversity [J].Neural Information Processing Systems. 2014:2078-2086.
[9]SEUNG H S, OPPER M, SOMPOLINSKY H. Query by committee [C]∥Fifth Annual Workshop on Computational Learning Theory. ACM, 1992: 287-294.
[10]JIANG L, MENG D, ZHAO Q, et al. Self-paced curriculum learning [C]∥Twenty-Ninth AAAI Conference on Artificial Intelligence. IEEE, 2015.
[11]MATTISEN T,OLIVER A,COHEN T.Teacher-student curriculum learning [J].IEEE Transactions on Neural Networks and Learning Systems,2019:1-9.
[12]PI T, LI X, ZHANG Z, et al. Self-paced boost learning for classification [C]∥International Joint Conference on Artificial Intelligence, 2016:1932-1938.
[13]CHEN W, GOU S, WANG X, et al. Classification of PolSAR images using multilayer autoencoders and a self-paced learning approach [J]. Remote Sensing, 2018, 10(1): 110.
[14]ZHOU S, WANG J, MENG D, et al. Deep self-paced learning for person re-identification [J]. Pattern Recognition,2018, 76:739-751.
[15]ZHAO Q, MENG D, JIANG L, et al. Self-paced learning for matrix factorization [C]∥Twenty-Ninth AAAI Conference on Artificial Intelligence,2015.
[16]BREIMAN L. Random forests [J]. Machine learning,2001,45(1):5-32.
[17]BACHMAN P, SORDONI A, TRISCHLER A. Learning algorithms for active learning [C]∥The 34th International Conference on Machine Learning. JMLR, 2017:301-310.
[18]LEWIS D D, CATLETT J. Heterogeneous uncertainty sampling for supervised learning [C]∥In Machine Learning Proceedings.Morgan Kaufmann,1994:148-156.
[19]FREY B J, DUECK D. Clustering by passing messages between data points [J]. Science, 1995, 315(5814):972-976.
[20]CHEN L C, PAPANDREOU G, KOKKINOS I, et al. Semantic image segmentation with deep convolutional nets and fully connected crfs [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 40(4):834-848.
[21]KANSKI J J, BOWLING B. Clinical Ophthalmology: ASystematic Approach [M]. Elsevier Health Sciences. 2017.
[22]STAAL J, ABRMOFF M D, NIEMEIJER M, et al. Ridge-based vessel segmentation in color images of the retina [J]. IEEE Transactions on Medical Imaging, 2004, 23(4):501-509.
[23]HOOVER A D, KOUZNETSOVA V, GOLDBAUM M. Locating blood vessels in retinal images by piecewise threshold probing of a matched filter response [J]. IEEE Transactions on Medical Imaging, 2000, 19(3): 203-210.
[24]POHLEN T, HERMANS A, MATHIAS M, et al. Full-resolution residual networks for semantic segmentation in street scenes [C]∥IEEE Conference on Computer Vision and Pattern Recognition.IEEE,2017:4151-4160.
[25]ROCKAFELLAR R T, WETS R J B. Variational analysis [M].Berlin:Springer Science & Business Media,1998:317.
[26]張三海, 盧明科, 鄒仁民,等. X線胸部透視與胸部攝片輻射劑量對比分析[J]. 人民軍醫(yī), 2006, 50(7):425-426.
ZHANG S H, LU M K, ZOU R M, et al. Comparative analysis of radiation dose between X-ray chest fluoroscopy and chest radiograph [J]. People′s Military Surgeon, 2006, 50(7): 425-426.
[27]VANG B, STEGMANN M B, LOOG M. Segmentation of anatomical structures in chest radiographs using supervised methods:A comparative study on a public database [J]. Medical Image Analysis, 2006, 10(1):19-40.
[28]CANDEMIR S, JAEGER S, PALANIAPPAN K, et al. Lung segmentation in chest radiographs using anatomical atlases with nonrigid registration [J]. IEEE Transactions on Medical Imaging, 2013, 33(2):577-590.
[29]VALADA A, VERTENS J, DHALL A, et al. Adapnet: Adaptive semantic segmentation in adverse environmental conditions [C]∥IEEE International Conference on Robotics and Automation.IEEE,2017:4644-4651.
[30]徐亮, 李萬湖, 陳兆秋. 核素圖像體外標記物的研制及在圖像融合中的初步應(yīng)用[J]. 中國醫(yī)學影像技術(shù), 2016, 32(11):1749-1752.
XU L, LI W H, CHEN Z Q. The development of in vitro marker for nuclide image and its preliminary application in image fusion [J]. Chinese Journal of Medical Imaging Technology, 2016, 32(11):1749-1752.
[31]ARBEL E, REMER I, BEN-DOR A. Deep Learning Based Partial Annotation Framework for Instance Segmentation in Histopathology Images[EB/OL].[2019/4/17]. https:∥openreview.net/forum?id=H1lhBhpN9V.
[32]KUMAR N, VERMA R, ANAND D, et al. A Multi-organ Nucleus Segmentation Challenge [J]. IEEE Transactions on Medical Imaging,2019:1.
[33]JGOU S, DROZDZAL M, VAZQUEZ D, et al. The one hundred layers tiramisu: Fully convolutional densenets for semantic segmentation [C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops.IEEE,2015:11-19.
(編 輯 李 靜)
收稿日期:2019-12-12
基金項目:國家自然科學基金資助項目(61971350,61901374);陜西省自然科學基金資助項目(2017JQ4007)
作者簡介:曹源,男,寧夏銀川人,從事影像組學研究。
通信作者:賀小偉,男,陜西榆林人,教授,博士生導師,從事光學分子影像、醫(yī)學圖像處理及可視化研究。