陳進(jìn)楊,王雪真,洪金省,鐘 婧,時 鵬
1(福建師范大學(xué) 計算機與網(wǎng)絡(luò)空間安全學(xué)院,福州 350117)
2(福建醫(yī)科大學(xué) 附屬第一醫(yī)院 放療科,福州 350001)
3(福建醫(yī)科大學(xué) 福建省腫瘤醫(yī)院 放射科,福州 350014)
4(福建師范大學(xué) 數(shù)字福建環(huán)境監(jiān)測物聯(lián)網(wǎng)實驗室,福州 350117)
腦膠質(zhì)瘤(glioma)是中樞神經(jīng)系統(tǒng)中最常見的原發(fā)性腫瘤[1].成年人中,腦膠質(zhì)瘤占所有腦腫瘤的30%~40%,占腦部惡性腫瘤的80%左右[2].世界衛(wèi)生組織(world health organization,WHO)中樞神經(jīng)系統(tǒng)腫瘤分類將膠質(zhì)瘤分為I~I(xiàn)V 級,其中I、II 級為低級別腦膠質(zhì)瘤(low grade glioma,LGG),III、IV 級為高級別腦膠質(zhì)瘤(high grade glioma,HGG).我國腦膠質(zhì)瘤發(fā)病率為每10 萬人有5~8 人,5年病死率在全身腫瘤中僅次于胰腺癌和肺癌[3].
磁共振成像(magnetic resonance imaging,MRI)具有無輻射損傷、高對比度等多種特點,使得它成為了非侵入式鑒別腦腫瘤的重要技術(shù)之一,廣泛應(yīng)用于臨床檢測[4].目前,MRI 的4 種成像技術(shù)常用于膠質(zhì)瘤的臨床診斷,分別為平掃T1 加權(quán)(T1-weighted MRI,T1)、對比增強T1 加權(quán)(T1-weighted MRI with gadolinium enhancing contrast,T1c)、T2 加權(quán)成像(T2-weighted MRI,T2)和液體衰減反轉(zhuǎn)恢復(fù)的T2 加權(quán)成像(T2-weighted MRI with fluid-attenuated inversion recovery,FLAIR).不同成像模態(tài)能夠提供各方面的信息來分析腦腫瘤信息,臨床上通常結(jié)合以上4 種圖像共同診斷腦腫瘤出血、壞死、水腫等病灶組織的信號強度、占位情況,確定腫瘤病變的侵襲范圍[5].由于腦部MRI 序列圖像的數(shù)據(jù)量龐大,人工分割不僅費時而且效率低下,并且人工分割的結(jié)果受醫(yī)生的專業(yè)知識和操作熟練度的影響,可能會產(chǎn)生較大差異的結(jié)果.因此,腦腫瘤分割仍然是一項艱巨的任務(wù)[6].
近年來,對MRI 影像中腦腫瘤病灶進(jìn)行分割的研究是腦膠質(zhì)瘤影像輔助診斷治療的熱點之一[7].常見的腦腫瘤MRI 圖像分割方法主要分為以下幾類方法:基于閾值的分割方法[8,9]、基于區(qū)域增長的分割方法[10,11]、基于機器學(xué)習(xí)的分割方法[12-14]、基于深度學(xué)習(xí)的分割方法等[5,15,16].基于閾值的分割方法通過將圖像的灰度值與閾值進(jìn)行比較,從而實現(xiàn)圖像的分割.但是這種方法需要人為的設(shè)置閾值,容易產(chǎn)生過分割或欠分割.基于區(qū)域生長的分割方法實現(xiàn)簡單,對灰度單一,紋理清晰的圖像分割結(jié)果較好,但是容易受到局部噪聲和不均灰度的影響導(dǎo)致過度分割.基于機器學(xué)習(xí)的分割方法通過人工構(gòu)造特征,然后利用隨機森林[17]或支持向量機[18]等分類器進(jìn)行分類.Nabizadeh 等[19]通過提取統(tǒng)計特征、紋理特征和Gabor 特征,然后利用SVM對其進(jìn)行分類,得到最終的分割結(jié)果.但是在特征提取階段,只在單個空間域或者頻域上提取特征,如果只考慮到單個領(lǐng)域的信息,有可能會丟失其他領(lǐng)域中某種重要的信息.
目前,深度學(xué)習(xí)已廣泛應(yīng)用于醫(yī)學(xué)圖像處理當(dāng)中.Long 等[20]提出了全卷積神經(jīng)網(wǎng)絡(luò)(fully convolutional neural networks,FCNN),通過利用卷積層替代了卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)中的全連接層,實現(xiàn)從圖像級分類到像素級分類的轉(zhuǎn)化.Ronneberger 等[21]對FCN 進(jìn)行了網(wǎng)絡(luò)結(jié)構(gòu)改進(jìn)提出了U-Net 網(wǎng)絡(luò),通過利用跳躍連接的方式將圖像的深層信息和淺層信息相結(jié)合,實現(xiàn)了對醫(yī)學(xué)圖像分割,奪得了2019年腦腫瘤挑戰(zhàn)賽冠軍.Huang 等[22]利用DenseNet和注意力機制改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),獲得了較好的結(jié)果.雖然基于深度學(xué)習(xí)的分割方法能夠獲得較好的分割結(jié)果,但是需要依賴大量的標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練.然而在醫(yī)學(xué)圖像的分割任務(wù)中,對數(shù)據(jù)集進(jìn)行人工標(biāo)注不僅費用高昂而且需要大量的時間與精力,并且對標(biāo)注人員還要求具有相關(guān)的專業(yè)技術(shù),因此無法獲得大量的標(biāo)注數(shù)據(jù).
半監(jiān)督學(xué)習(xí)[23]是介于傳統(tǒng)監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)之間的一種機器學(xué)習(xí)方法.其思想是在標(biāo)注樣本數(shù)量較少的情況下,通過利用大量的無標(biāo)注樣本對模型進(jìn)行訓(xùn)練,從而解決監(jiān)督學(xué)習(xí)中訓(xùn)練樣本不足的問題.它的核心問題是先驗假設(shè)的一致性,其一是距離較近的樣本較大可能具有相同的標(biāo)簽;其二就是流形假設(shè),即假設(shè)數(shù)據(jù)分布在一個流形結(jié)構(gòu)上,鄰近的樣本擁有相似的輸出值.在標(biāo)記樣本很少的情況下,通過在模型訓(xùn)練中引入無標(biāo)記樣本來避免傳統(tǒng)監(jiān)督學(xué)習(xí)在訓(xùn)練樣本不足時出現(xiàn)性能退化的問題.一方面解決了獲取標(biāo)記樣本成本過高的問題,另一方面能夠取得與傳統(tǒng)監(jiān)督學(xué)習(xí)算法相近甚至更好的效果.圖半監(jiān)督學(xué)習(xí)作為半監(jiān)督學(xué)習(xí)中的一種分支,通過將少量的標(biāo)注樣本和大量的無標(biāo)注樣本構(gòu)造成圖,然后將圖中的無標(biāo)注樣本進(jìn)行標(biāo)注.Zhou 等[24]利用拉普拉斯矩陣,將無標(biāo)注樣本進(jìn)行傳播,對其進(jìn)行標(biāo)注.Iscen 等[25]通過利用最小化信息熵獲得置信度高的預(yù)測分布作為偽標(biāo)簽,并作為標(biāo)準(zhǔn)交叉熵?fù)p失來訓(xùn)練目標(biāo).
綜上,針對腦腫瘤的分割任務(wù),本文提出了一種局部-全局自適應(yīng)信息學(xué)習(xí)分割算法.通過利用空間域和頻域相結(jié)合的方法對4 個模態(tài)分別提取特征,得到增強特征用于表達(dá)腦部結(jié)構(gòu)信息;并將4 個模態(tài)提取到的特征進(jìn)行融合,得到最終的融合特征;采用 ALGIL 算法,可以用于標(biāo)注數(shù)據(jù)較少的分割任務(wù)當(dāng)中.本文首先利用小波變換將圖像從空間域變換到頻域當(dāng)中,從低頻和高頻中提取統(tǒng)計特征和紋理特征;通過從專家的粗略標(biāo)注結(jié)果中隨機選取標(biāo)注數(shù)據(jù),利用隨機森林算法生成最終的特征集并且獲得特征權(quán)重;利用ALGIL 算法,通過將隨機森林算法得到的特征權(quán)重對圖像進(jìn)行加權(quán)構(gòu)造相似性矩陣,然后利用指數(shù)衰減函數(shù)自適應(yīng)調(diào)整初始標(biāo)注樣本對算法的影響程度獲得最終的分割結(jié)果.實驗結(jié)果表明該方法在減少標(biāo)注數(shù)據(jù)的同時保證腫瘤分割的精度,顯著提高圖像分割效率,所產(chǎn)生的量化指標(biāo)為腦膠質(zhì)瘤核磁的早期臨床診斷提供了依據(jù).
為了解決上述的問題,本文提出一種局部-全局自適應(yīng)信息學(xué)習(xí)分割算法,包括特征提取、特征選擇以及ALGIL 算法.本文提出的方法的流程如圖1所示.
圖1 局部-全局自適應(yīng)信息學(xué)習(xí)的腦腫瘤磁共振圖像分割流程
如圖1所示,首先利用小波變換將圖像從空間域轉(zhuǎn)化到頻域,將圖像分解為1 個低頻子帶和3 個高頻子帶;然后從低頻子帶中提取統(tǒng)計特征,從3 個高頻子帶中提取紋理特征,將提取到的特征進(jìn)行融合;接著利用隨機森林算法對提取到的特征進(jìn)行選擇,得到最終的特征子集和特征權(quán)重;最后利用ALGIL 算法,利用特征權(quán)重對圖像進(jìn)行加權(quán)構(gòu)造相似性矩陣,并且使用指數(shù)衰減函數(shù)自適應(yīng)調(diào)整初始標(biāo)注數(shù)據(jù)對算法的影響程度,得到腫瘤分割結(jié)果.
基于影像組學(xué)的腦膠質(zhì)瘤特征提取是進(jìn)行腦膠質(zhì)瘤分割的關(guān)鍵一步.對于傳統(tǒng)的特征提取方法來說,僅考慮單個領(lǐng)域里的特征信息,并沒有考慮到不同領(lǐng)域直接是否存在著某種聯(lián)系.并且如果僅考慮單個元素,會忽視元素和鄰域元素之間的關(guān)系.因此本文提出小波統(tǒng)計紋理特征(wavelet statistical texture feature)提取方法.通過利用小波變換將圖像從空間域變換到頻域上,然后用大小為5×5 的窗口分別從低頻和高頻處提取相應(yīng)的空間信息.本文總共從MRI 圖像中提取了224 個定量圖像特征,分別為小波統(tǒng)計特征(wavelet statistical features,WSF)和小波紋理特征(wavelet texture features,WTF).
小波變換[26]具有多分辨率分析的特征,能夠?qū)D像從空間域轉(zhuǎn)換為頻域,并且可以在不同尺度下對圖像進(jìn)行分解和可視化.離散小波變換的定義如下:
其中,j,k∈Z,j表示小波函數(shù)在頻域上的伸縮,k表示小波函數(shù)的平移,?(t)表示小波函數(shù).在二維小波變換中,圖像由1 個近似圖像和3 個細(xì)節(jié)圖像表示,分別代表圖像的低頻和高頻信息.圖2(a)為經(jīng)過二維離散小波變換的分解過程,經(jīng)過一次離散小波變換圖像被分解為4 個子帶.LL 代表經(jīng)過兩層離散小波分解后的低頻部分,LH,HL,HH 分別代表水平、垂直和對角方向的細(xì)節(jié),是圖像的高頻部分.
本文重構(gòu)所采用的小波為Symlet 小波,該小波為雙正交小波,近似對稱,可以應(yīng)用于離散小波變換.通過實驗,本文采用sym4 小波函數(shù)作為小波母函數(shù),對MRI圖像進(jìn)行分解,小波母函數(shù)圖形如圖2(b)所示.圖2(c)表示為分解后的各個子帶的圖像.WSF 從小波的低頻子帶中提取,WTF 則從高頻子帶中提取.
圖2 離散小波圖像分解
1.1.1 小波變換的統(tǒng)計特征提取
在經(jīng)過離散小波變換以后,將圖像分解為低頻和高頻兩個部分,強度特征能夠直接反應(yīng)圖像的物理特性.因此本文從4 個模態(tài)的MRI 圖像的LL 子帶中提取小波統(tǒng)計特征,分別為均值、最大值、最小值、中值、方差、標(biāo)準(zhǔn)差、偏度、峰度.最后獲得32 維特征向量.
1.1.2 小波變換的紋理特征提取
小波紋理特征則通過高頻子帶借助灰度共生矩陣(gray level co-occurrence matrix,GLCM)得到的.GLCM通過計算像素相對距離(d=1)和4 個不同的方向(θ=0°,45°,90°,135°),并且對原始圖像灰度級量化成16 級得到的.計算出的12 個Haralick 紋理特征為:對比度、相關(guān)性、能量、同質(zhì)性、角二階矩、方差、差異性、熵、自相關(guān)、共生和方差、共生和熵、共生差方差.最后獲得192 維特征向量.
特征之間的相關(guān)性和冗余性會降低分類的準(zhǔn)確率,并且特征過多將會提高分類器的復(fù)雜度,造成過擬合,降低分類器的泛化能力,因此需要對特征集合進(jìn)行選擇和優(yōu)化.隨機森林是一種集成的機器學(xué)習(xí)方法,通過利用Bootstrap 抽樣技術(shù)生成不同的特征子集,利用不同的特征子集訓(xùn)練生成不同的決策樹.對于每棵樹給出最優(yōu)的分類結(jié)果,最終結(jié)果為k棵決策樹中得票最多的選擇.
由于利用Bootstrap 抽樣技術(shù),因此會有部分樣本沒有被選到,這部分樣本被稱為“out of bag(OOB)”.對于樣本(xn,yn)中,OOB 樣本數(shù)量大約為(1-1/N)N.因為OOB 樣本集能夠用來當(dāng)作測試集,OOB 誤差被用作驗證隨機森林的泛化誤差,公式如下:
其中,Eoob(G)為加入噪聲以后的OOB 誤差.每個特征參數(shù)的最終重要度得分是所有樹的平均值:
其中,N為決策樹的數(shù)量.通過最后得到的特征的重要性程度進(jìn)行排序,取重要性程度較高的部分特征作為最終的特征子集.本文中最終從224 維特征中選擇了32 維特征作為最終的特征子集.
為了解決醫(yī)學(xué)圖像中標(biāo)注信息過少的問題,本文提出了一種自適應(yīng)的局部-全局信息學(xué)習(xí)分割算法.該算法基于特征加權(quán)的思想,通過從隨機森林獲得的特征權(quán)重,利用權(quán)重向量構(gòu)造相似性矩陣,并且引入指數(shù)衰減函數(shù)自適應(yīng)調(diào)整標(biāo)簽對算法的影響程度.該算法的過程如下:
假設(shè)樣本集為X={x1,···,xm,xm+1,···,xn}?R,樣本標(biāo)簽為L={1,···,c}.記有標(biāo)簽的數(shù)據(jù)為Xl(l<m),無標(biāo)簽的數(shù)據(jù)為Xu(m+1 <u≤n).定義一個one-hot 矩陣Ync來標(biāo)記初始信息,如果樣本xi的標(biāo)簽為yj,則Yij=1,否則Yij=0;且未標(biāo)注的樣本Yij為零向量.
1)首先利用隨機森林算法得到的特征的重要性程度,然后利用對權(quán)重向量進(jìn)行歸一化,得到權(quán)重向量.利用高斯核函數(shù)與權(quán)重向量構(gòu)造一個樣本間的相似性矩陣W,當(dāng)i≠j時并且令樣本本身的值為0.其中xi,xj為樣本,σ為常數(shù).
2)計算W的對角矩陣即計算矩陣W的第i行之和.然后建立矩陣S=D-1/2WD-1/2.
3)初始化F(0)=Y,利用迭代對無標(biāo)注的樣本進(jìn)行標(biāo)注并更新,迭代公式如下:
其中,exp(-ut)為指數(shù)衰減函數(shù),u為衰減權(quán)重,本文設(shè)置為0.2,t為迭代次數(shù).為了自適應(yīng)調(diào)整初始標(biāo)簽對模型的影響,通過設(shè)置指數(shù)衰減函數(shù),在迭代初期,為了使模型保持良好的準(zhǔn)確率,初始標(biāo)簽的權(quán)重較高;隨著迭代次數(shù)的增加,模型趨于穩(wěn)定,初始標(biāo)簽的權(quán)重也隨之減小.
4)F*代表式(4)在迭代一定次數(shù)后收斂的結(jié)果,則xi的標(biāo)簽為:
本文構(gòu)建了基于定量影像組學(xué)的腫瘤分割方法,首先對數(shù)據(jù)集進(jìn)行預(yù)處理;然后通過空間域和頻域相結(jié)合的方法提取圖像的WSF 和WTF 特征,利用隨機森林選取最終的特征子集和特征權(quán)重;最后利用ALGIL算法對腫瘤進(jìn)行分類,得到最終的分割結(jié)果.在標(biāo)注數(shù)據(jù)的選取方面,由于精確的標(biāo)注數(shù)據(jù)不僅費時,而且需要消耗標(biāo)注人員的大量精力,而粗略的勾畫對標(biāo)注人員來說只需要少量的時間并且不需要太多的精力就能夠完成.因此本文在選取標(biāo)注樣本時,在保證勾畫的類別沒有錯誤的前提下讓專家對每個病例的2-3 張MRI 圖像進(jìn)行粗略勾畫.為了降低樣本不平衡帶來的影響,在初始選取標(biāo)注樣本時對正常區(qū)域的選取比例變大,增加正常區(qū)域的標(biāo)注樣本.為了驗證本文方法的有效性,本文通過一系列的對比實驗進(jìn)行比較,分別通過改變初始標(biāo)記的樣本個數(shù)以及改變模型的迭代次數(shù).此外,本文還通過與其他方法進(jìn)行比較來驗證本文提出的性能.
本文實驗使用的數(shù)據(jù)集來源于腦腫瘤公開數(shù)據(jù)集Brats2018,該數(shù)據(jù)集由訓(xùn)練集、驗證集和測試集組成.其中,訓(xùn)練集包含210 例高級別腫瘤病例和75 例低級別腫瘤病例,并且提供了相應(yīng)的分割結(jié)果.每個病人影像分別由T1、T1c、T2 和FLAIR 四種序列以及專家手動標(biāo)注的標(biāo)簽組成.標(biāo)簽將腦膠質(zhì)瘤劃分為3 個區(qū)域,分別為:整體腫瘤(whole tumor,WT)、腫瘤核心(tumor core,TC)和增強腫瘤核心(enhancing tumor core,ET).圖3 為數(shù)據(jù)集中同一組圖像的4 種模態(tài)的MRI 圖像以及專家手動標(biāo)注的標(biāo)簽圖像,其中藍(lán)色部分為水腫區(qū)域、粉紅色部分為腫瘤核心區(qū)域、綠色部分為增強腫瘤區(qū)域.這些數(shù)據(jù)集是經(jīng)過預(yù)處理后提供的,即共同注冊到相同的解剖模板,內(nèi)插到相同的分辨率(1 mm3)和顱骨剝離,每個MRI 序列的大小為240×240×155.
圖3 不同模態(tài)的MRI 圖像以及專家手動標(biāo)注的標(biāo)簽圖
首先由于數(shù)據(jù)集中4 個模態(tài)的序列對比度不同,因此對每個模態(tài)的圖像除黑色背景以外的區(qū)域歸一化至[0,1],具體歸一化公式為:
其中,Xmax為MRI 圖像的最大值,Xmin為MRI 圖像的最小值.并且為了得到更為光滑的分割結(jié)果,采用形態(tài)學(xué)操作對最終的分割結(jié)果進(jìn)行后處理.
為了衡量本文分割方法的準(zhǔn)確性,本文采用Dice、Sensitivity、Hausdorff distance(HD)作為評價指標(biāo),公式分別如下:
Dice相似系數(shù)(dice similarity coefficient,DSC)用于衡量兩個樣本之間的相似程度,是一種幾何相似度度量的指標(biāo),DSC 值越大說明兩個樣本的相似性程度越高.計算公式為:
靈敏度(Sensitivity)表示在所有陽性樣本中預(yù)測出真陽性所占的比例,計算公式為:
豪斯多夫距離表示預(yù)測結(jié)果的邊界與專家手動標(biāo)注的標(biāo)簽邊界之間的距離,是分割誤差最大的標(biāo)志.預(yù)測結(jié)果越好,dH(A,B)值越小,dH(A,B)的定義為:
為了驗證初始標(biāo)注樣本數(shù)量對模型性能的影響,本文通過隨機從專家粗略標(biāo)記的標(biāo)簽中隨機抽取樣本數(shù)進(jìn)行試驗,并且由于腫瘤與正常組織樣本差異過大,為了解決正常組織樣本過多的問題,本文在樣本數(shù)量的設(shè)置上對正常組織樣本的數(shù)量有所增加.本文通過對3 種腫瘤樣本數(shù)量分別設(shè)置為10-200,每次增加10 個樣本;正常組織的樣本數(shù)量設(shè)置為2 500-5 000,每次增加250 個樣本.不同標(biāo)注樣本數(shù)量對模型性能的實驗結(jié)果如圖4所示,其中紫色方柱表示精度,藍(lán)色折線表示靈敏度.圖5 為不同標(biāo)注樣本數(shù)量的分割結(jié)果對比圖.
圖4 不同初始標(biāo)注樣本的實驗結(jié)果
圖5 不同初始標(biāo)注樣本的結(jié)果對比
由圖4 可知,模型性能的準(zhǔn)確性在0.9 以上,但是不同的標(biāo)注樣本的數(shù)量對模型的精度有一定的影響.因此本文根據(jù)實驗結(jié)果選取腫瘤樣本數(shù)量為150,正常組織樣本數(shù)量為3 750.
由圖5 可以看出,在初始標(biāo)注樣本數(shù)量較少時,分割效果較差,有很大一部分的腫瘤被標(biāo)注成正常組織.隨著初始標(biāo)注樣本的增加,分割結(jié)果越來越接近于專家手動標(biāo)注的結(jié)果.
為驗證本文所提出模型的有效性,利用Brats2018數(shù)據(jù)集測試,測試了該模型在各類分割區(qū)域的平均分割精度.圖6 為本文分割模型對其中3 名病例的4 種模態(tài)的MRI 圖像腦腫瘤預(yù)測分割結(jié)果,其中圖6(a)-圖6(d)為4 種模態(tài)圖像,圖6(e)為專家手動標(biāo)注的標(biāo)簽圖,圖6(f)為本文分割模型的預(yù)測分割結(jié)果.
由圖6 可見,本文所提出的分割模型得到的分割結(jié)果與專家手動標(biāo)注的結(jié)果相近,并且對于難以精確分割的增強腫瘤區(qū)域,分割結(jié)果也與專家標(biāo)注的結(jié)果較為接近.表明本文所提出的模型具有較高的穩(wěn)定性和準(zhǔn)確性.
圖6 本文模型分割結(jié)果對比
本文分割模型在各個腫瘤區(qū)域的分割評價指標(biāo)如表1所示.本文所提出的分割模型在各腫瘤區(qū)域的分割效果都達(dá)到了令人滿意的結(jié)果,Dice相似系數(shù)與靈敏度均高于0.8.其中,整體腫瘤的Dice相似系數(shù)與靈敏度均高于腫瘤核心與增強腫瘤核心,說明自動分割結(jié)果與標(biāo)注結(jié)果的內(nèi)部相似性較高,但HD95 較高,這可能是由于腫瘤浸潤導(dǎo)致邊緣模糊,使分割結(jié)果與標(biāo)注結(jié)果的形狀相似性較差.而相對于整體腫瘤和腫瘤核心,對增強腫瘤核心的分割效果較差,這可能是腫瘤的內(nèi)部結(jié)構(gòu)復(fù)雜,有壞死、囊變或鈣化等成分,在增強MRI 上呈低信號,而腫瘤實性組織呈高信號,出現(xiàn)信號不均從而導(dǎo)致增強腫瘤的分割效果較低.
表1 各個腫瘤子區(qū)域分割結(jié)果對比
本文分別對Brats2018 數(shù)據(jù)集的分割結(jié)果進(jìn)行定量評價,由于本文方法需要對每個病例的2-3 張腫瘤圖像進(jìn)行粗略標(biāo)注,因此本文僅在訓(xùn)練集上進(jìn)行測試.本文分別與Aboelenein[27]提出的HTTU-Net、Gates[28]提出的MSCNN、Weninger[29]提出的3D-Unet 三種不同的模型進(jìn)行比較.表2 為不同模型在不同類型的腫瘤的分割結(jié)果的平均指標(biāo).
表2 不同模型的腫瘤分割結(jié)果對比
從表2 可以看出本文所提出的分割模型所得的腦膠質(zhì)瘤分割結(jié)果在一定程度上優(yōu)于其他模型.WT、TC和ET 的Dice指標(biāo)都優(yōu)于其他模型,分別為0.947、0.849 和0.830.而Sensitivity指標(biāo)分別為0.921、0.803和0.815.并且HD 指標(biāo)要優(yōu)于其他模型,分別為3.791、2.667 和2.036.
本文方法的分割結(jié)果與真實數(shù)據(jù)之間平均Dice指標(biāo)達(dá)到0.875,平均Sensitivity指標(biāo)達(dá)到0.846,平均HD95 指標(biāo)達(dá)到2.831.與其他模型相比,本文方法具有更好的魯棒性,每種類型的平均指標(biāo)相對穩(wěn)定,并且相對于其他模型來說,本文所提出的分割模型為半監(jiān)督學(xué)習(xí)的分割方法.只需要少量的標(biāo)注樣本就能夠達(dá)到其他監(jiān)督學(xué)習(xí)的模型效果.不僅節(jié)省了大量標(biāo)注所需要的時間,同時也節(jié)省了標(biāo)注時所需的大量費用.
MRI 腦腫瘤精確分割對準(zhǔn)確的診斷和手術(shù)治療方案具有重要意義.但是腫瘤的大小、形狀、位置和灰度值等特征變化大并且復(fù)雜,而手動分割耗時且會受到主觀差異的影響.因此自動精確分割腫瘤是一項艱巨的任務(wù).
在腦腫瘤分割任務(wù)方法中,本文針對傳統(tǒng)機器學(xué)習(xí)中提取特征單一化的缺陷,并且針對監(jiān)督學(xué)習(xí)中所需標(biāo)記的樣本數(shù)據(jù)量大,而無監(jiān)督學(xué)習(xí)中分割效果較差等缺陷,提出了一種基于局部-全局自適應(yīng)信息學(xué)習(xí)的分割算法.本文所提出的方法將空間域和頻域結(jié)合進(jìn)行特征提取,采用隨機森林算法獲取特征子集及特征權(quán)重,最后通過局部-全局自適應(yīng)信息學(xué)習(xí)分割算法對圖像進(jìn)行分割.實驗結(jié)果表明,通過將空間域的圖像轉(zhuǎn)化到頻域上,能夠更準(zhǔn)確地提取圖像中的有效信息.此外本文提出的分割模型相較于普通的全監(jiān)督學(xué)習(xí)方法,在少量標(biāo)注數(shù)據(jù)的條件下,預(yù)測結(jié)果達(dá)到甚至超過全監(jiān)督方法,在內(nèi)部結(jié)構(gòu)更為復(fù)雜的TC 和ET 中分割結(jié)果也近似于專家的標(biāo)注結(jié)果.
對于醫(yī)學(xué)圖像中標(biāo)記樣本稀缺的情況下,本文方法利用半監(jiān)督學(xué)習(xí)的思想,僅用少量的標(biāo)注數(shù)據(jù)就能夠得到較為準(zhǔn)確的分割結(jié)果.不僅解決了監(jiān)督學(xué)習(xí)中需要大量的標(biāo)記樣本的問題,還確保了最終分割結(jié)果的精度不因為標(biāo)記樣本的減少而下降.同時本文中也存在些許不足,例如全連接測量整張圖像的像素之間的距離而導(dǎo)致耗時較長;在標(biāo)記樣本的選取中,還需要專家對圖像進(jìn)行標(biāo)注.為來考慮利用稀疏矩陣的方法構(gòu)造相似性矩陣,提升模型的計算速度;利用無監(jiān)督聚類的思想對數(shù)據(jù)集進(jìn)行初始聚類,得到聚類中心,選取置信度高的樣本作為標(biāo)注樣本,省去專家標(biāo)注的步驟.