国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積網(wǎng)絡(luò)的老年黃斑變性識別方法

2022-07-08 03:35王劍
電子技術(shù)與軟件工程 2022年8期
關(guān)鍵詞:變性黃斑濾波器

王劍

(山西醫(yī)科大學(xué)汾陽學(xué)院 山西省汾陽市 032200)

1 引言

老年黃斑變性(AMD)一種與年齡相關(guān)的眼部疾病。AMD 因其早期現(xiàn)象不明顯、且不可逆性,成為了老年人(>50歲)中視力喪失的主要原因。目前世界人口的老齡化結(jié)構(gòu)越來越明顯,尤其以中國為主的發(fā)展中人口大國老齡化現(xiàn)象十分嚴(yán)峻,據(jù)有關(guān)報道研究,到2050 年,全球AMD 的患者數(shù)量將突破20 億人。AMD 是由于黃斑退化導(dǎo)致視力下降的慢性疾病,通常,AMD 可以分為四個階段,分別為無、早期、中間和晚期。當(dāng)眼底出現(xiàn)少量的小玻璃疣時,此時不會對視力造成太大的影響,不會對AMD 進行分級,如果存在中小型玻璃疣,則對早期的AMD 進行分級。黃斑變性可以分為兩大類型,一類是干性,另一類是濕性。干性黃斑變性的特點是當(dāng)黃斑處的視網(wǎng)膜色素上皮細胞丟失時,眼底出現(xiàn)玻璃疣沉積,表現(xiàn)為瘢痕形式,最終可能造成不可逆轉(zhuǎn)的視力喪失;濕性黃斑變性的主要特點是突發(fā)性,發(fā)展較快,其主要的原因是眼底出現(xiàn)了異常的新生血管,極易造成黃斑區(qū)出血,導(dǎo)致視力極速下降。一般來說,早期的AMD 是沒有任何癥狀的,針對一些視力模糊,可能已經(jīng)發(fā)展到了中期,而對于晚期的AMD 來說,通過眼底圖像是極易分辨出來的,但是已經(jīng)造成了視力的不可逆轉(zhuǎn)。因此,AMD的早期的診斷,對于AMD 的進一步惡化具有重要的意義。眼底圖像是診斷AMD 的主要手段,然而,眼底圖像的診斷需要有醫(yī)生的主觀意見,并且由于醫(yī)生個體間的差異,極易造成診斷的差異。因此,利用計算機進行自動化的黃斑變性診斷,可以為醫(yī)生提供可靠的輔助診斷依據(jù),不僅能為患者提供高效的醫(yī)療服務(wù),而且能平衡各地的醫(yī)療資源,具有及其重要的現(xiàn)實意義。

針對以上問題,本文提出了一個十二層的深度卷積網(wǎng)絡(luò),通過患者的眼底圖像來自動診斷AMD。與傳統(tǒng)的自動診斷系統(tǒng)相比,基于卷積網(wǎng)絡(luò)的診斷方法不需要手工提取特征,利用卷積的特性,可以自動的提取眼底圖像的低級特征與高級語義特征。

深度卷積網(wǎng)絡(luò)是近年來發(fā)展起來的一項人工智能技術(shù),并且成為了醫(yī)學(xué)圖像分析領(lǐng)域的主要方法之一,文獻提出了一種基于深度學(xué)習(xí)的自動篩選系統(tǒng),將眼底圖像分類為正常或萎縮性AMD。文獻提出了基于殘差網(wǎng)絡(luò)的篩選系統(tǒng),設(shè)計了一個基于殘差結(jié)構(gòu)的50 層網(wǎng)絡(luò),利用交叉熵損失函數(shù)和Adma 優(yōu)化器進行訓(xùn)練。訓(xùn)練使用由400 張圖像組成的私有數(shù)據(jù)集進行,其中驗證集40 張,測試集200張,模型使用了ImageNet 數(shù)據(jù)庫上的預(yù)訓(xùn)練權(quán)重,最終的準(zhǔn)確率達到了0.98,靈敏度為0.95,特異性為1。文獻,提出了一種自動篩查方法,可以在早期階段從眼底圖像中檢測 AMD。該方法基于多實例學(xué)習(xí)框架。首先,檢測中央凹以裁剪黃斑區(qū)域。 然后,進行迭代訓(xùn)練,直到到達設(shè)定的準(zhǔn)確度,或者精度不在變化,或者超過訓(xùn)練時間閾值即停止訓(xùn)練。作者使用三種不同的模型(VGG16、ResNet-50 和Inception v3)評估了相同的方法,最終選擇了性能較好的VGG16 模型。

2 數(shù)據(jù)收集

本文所使用的數(shù)據(jù)集來自MESSIDOR 公開數(shù)據(jù)集,以及Kaggle 平臺Segmentation of OCT images(AMD)比賽數(shù)據(jù)集。該數(shù)據(jù)集是目前為止國外最大的眼底圖像數(shù)據(jù)庫,共有1200 張眼底圖像,其中540 張正常圖像,660 張異常圖像,主要標(biāo)記由糖尿病引發(fā)的視網(wǎng)膜疾病與黃斑水腫。Kaggle 平臺提供的AMD 分割數(shù)據(jù)集中,AMD 眼底圖像總共269 張。本文選取MESSIDOR 數(shù)據(jù)集中的540 張正常圖像作為正樣本,選取Kaggle 平臺中的269 張AMD 圖像作為負樣本。

2.1 感興趣區(qū)域提取

MESSIDOR 中的圖像如圖1 所示。眼底圖像由兩部分組成,眼底圖和黑色背景,其中的背景信息是分類所不需要的,并且會影響網(wǎng)絡(luò)的分類性能,因此,需要在進行分類之前對圖片進行預(yù)處理操作,即提取圖片的感興趣區(qū)域(Region of Interest, ROI)

圖1: MESSIDOR 中的正常眼底圖像

感興趣區(qū)域(ROI)是一張圖片中重點所關(guān)注的區(qū)域。在眼底圖像中即圓形或者橢圓形的視網(wǎng)膜區(qū)域。為了提取眼底圖像的感興趣區(qū)域,本文選取了文獻中所介紹的最大類間方差法,自適應(yīng)的完成前景與背景間的閾值計算。提取后的圖像如圖2 所示。

圖2: 感興趣區(qū)域提取結(jié)果

2.2 圖像預(yù)處理

圖像預(yù)處理操作的好壞直接影響深度學(xué)習(xí)網(wǎng)絡(luò)的性能,是提升網(wǎng)絡(luò)性能的關(guān)鍵。本研究所使用的眼底圖像在分辨率指標(biāo)方面表現(xiàn)較好,但是在對比度,亮度、以及噪聲、尺寸方面卻不太理想。為此本文使用了一系列的圖像預(yù)處理方法,對數(shù)據(jù)集進行了預(yù)處理操作,之后的數(shù)據(jù)擴增方法在預(yù)處理后的數(shù)據(jù)集上進行擴增。

首先在對比度和亮度方面,本文采用了亮度均衡化和對比度均衡化的方法,這樣能夠使圖像的信息不被亮度所干擾,得到圖像的歸一化數(shù)據(jù)。

為了保證圖像的質(zhì)量,本文選取了雙邊濾波器,來降低眼底圖像中的噪聲。

雙邊濾波器是一種充分使用了圖像空間信息的非線性的濾波方法,該濾波器是源于高斯濾波器的。雙邊濾波器在充分使用像素值的同時,還能考慮其周邊的圖像信息,并做出適當(dāng)?shù)奶幚?,最終在達到去噪的同時保留邊緣信息的效果。

相比于傳統(tǒng)的濾波器,例如高斯濾波去噪,雙邊濾波器的最大特點是能夠很好的保存圖像的邊緣信息,而不會像傳統(tǒng)濾波器那樣使的邊緣變得模糊,最終造成圖像高頻信息丟失的結(jié)果。綜上所述,雙邊濾波器不單可以去除噪聲,還能夠保存眼底圖像中的邊緣與細節(jié)信息。而本文基于眼底圖像的黃斑變性識別,對眼底圖像的邊緣信息較為敏感,因此在使用去噪方法后,因盡可能的保留邊緣信息,所以選擇了雙邊濾波器作為圖像的去噪方法。在圖像去噪以后,統(tǒng)一將圖像設(shè)置為227×227 大小。

2.3 數(shù)據(jù)集擴增

醫(yī)學(xué)圖像與自然圖像相比,面臨的最大問題是數(shù)據(jù)集的匱乏,由于醫(yī)學(xué)圖像的特殊性,醫(yī)學(xué)圖像的收集與標(biāo)注極為困難,為了提升模型的泛化性能,應(yīng)盡可能收集較多的數(shù)據(jù)集。為了解決以上問題,本文使用了數(shù)據(jù)擴增的方法,主要包括旋轉(zhuǎn)、平移、翻轉(zhuǎn)、縮放等操作。旋轉(zhuǎn)即對原始圖像進行任意度數(shù)(<20°)的旋轉(zhuǎn)偏移。翻轉(zhuǎn)即對原始圖像進行水平或者垂直翻轉(zhuǎn)。裁剪即在原始圖像隨機裁剪出一部分,作為一張新的眼底圖像,一般來說裁剪的區(qū)域應(yīng)該大于70%。具體的如圖3 所示。

圖3: 數(shù)據(jù)集擴增效果

3 方法

3.1 GoogleNet

GoogleNet 模型在ILSVRC2014 的競賽中獲得了冠軍,GoogleNet 的成功,主要是來源于網(wǎng)絡(luò)中使用了Inception 這一網(wǎng)絡(luò)結(jié)構(gòu),通過這一結(jié)構(gòu)不僅增加了網(wǎng)絡(luò)的深度和寬度,而且縮減了網(wǎng)絡(luò)中的參數(shù),提升了一定的運算性能。

GoogleNet 中包含了9 個Inception 模塊,網(wǎng)絡(luò)層數(shù)較多,如果單獨計算網(wǎng)絡(luò)層數(shù)的話,GoogleNet 中的網(wǎng)絡(luò)層達到了100 多層。GoogleNet 為了方便搭建深層網(wǎng)絡(luò),構(gòu)建了基礎(chǔ)模塊,每個模塊基本相同,只是輸出圖像大小和通道數(shù)略有不同而已。GoogleNet 使用的激活函數(shù)為ReLU 函數(shù),網(wǎng)絡(luò)所能達到的最大感受野大小為224×224。Inception 之所以能夠減少參數(shù),其主要的思路是在使用3×3 和5×5 進行卷積操作時,會使用1×1 的卷積進行降維操作,其原因是5×5的卷積計算量較大,所以增加了降維操作。GoogleNet 利用不同的卷積核進行并行連接,在保證感受野的同時還能對圖像進行不同特征的提取,最后完成圖像特征的拼接,豐富了圖像的特征信息。GoogleNet 利用平均池化代替了全連接層,并且使用了Dropout 隨機函數(shù),避免網(wǎng)絡(luò)的過擬合現(xiàn)象。GoogleNet 網(wǎng)絡(luò)的成功,使得后續(xù)出現(xiàn)了InceptionV2,V3,V4 等模塊,不斷的提高Inception 的模塊性能。

InceptionV2 模塊,其主要的改進是在Inception 中加入了Batch Normalization。

Batch Normalization 是為了解決深度網(wǎng)絡(luò)所帶來的梯度消失而出現(xiàn)的,由于越深的網(wǎng)絡(luò),其網(wǎng)絡(luò)層數(shù)也越多,而數(shù)據(jù)在經(jīng)過每一層網(wǎng)絡(luò)之后,其數(shù)據(jù)的分布也發(fā)生了改變。那么這會使得網(wǎng)絡(luò)尋找數(shù)據(jù)的規(guī)律變難,為此在深度網(wǎng)絡(luò)中一般都是使用較小的學(xué)習(xí)率,以及特定的參數(shù)初始化值,防止網(wǎng)絡(luò)梯度消失,但是這樣會造成網(wǎng)絡(luò)訓(xùn)速度變慢。變慢的主要原因是數(shù)據(jù)的分布發(fā)生了變化,為了保證數(shù)據(jù)分布的一致性,加入了BN 層,在網(wǎng)絡(luò)的每一層后加入BN 層,對數(shù)據(jù)進行歸一化操作,保證數(shù)據(jù)的分布不改變,這樣加入BN 層后,即可使用較大的學(xué)習(xí)速率,從而加快網(wǎng)絡(luò)的收斂速度,在一定程度上還會防止梯度的消失,使得訓(xùn)練具有較多層次的網(wǎng)絡(luò)結(jié)構(gòu)成為了可能 。本文后續(xù)的網(wǎng)絡(luò)設(shè)計,受到了該模塊的影響,在設(shè)計時加入了Inception-V2 模塊。

3.2 VGG

VGGNET 是由牛津大學(xué)和谷歌共同提出的一個深度卷積網(wǎng)絡(luò),VGG 其主要結(jié)構(gòu)是卷積網(wǎng)絡(luò),在2014 年的ImageNet 比賽中獲得了亞軍,冠軍則是3.1 節(jié)所介紹的GoogleNet。VGG 的版本較多,共有6 種不同結(jié)構(gòu),最常用的是VGG-16 版本,該版本的卷積層個數(shù)為13,全連接層的個數(shù)為3,還包括池化層,池化層為5 層。VGG 雖然是亞軍,但其獨特的設(shè)計理念還是引發(fā)了諸多研究者的青睞。

VGG 網(wǎng)絡(luò)的結(jié)構(gòu)特點是比較明顯的,具體的,VGG 中的各卷積層結(jié)構(gòu)基本相同,并且使用的池化操作也相同,都是將上一卷積層特征縮減一半,并且使用的都是較小的卷積核,因而深度也較深,保證網(wǎng)絡(luò)的較大感受野。本文后續(xù)的網(wǎng)絡(luò)設(shè)計,受到了該模塊的影響,在設(shè)計時加入了VGG 網(wǎng)絡(luò)的思想。

3.3 VG-AMD

為了提高深度卷積網(wǎng)絡(luò)的準(zhǔn)確性,在設(shè)計VG-AMD 時使用了Inception-V2 模塊結(jié)構(gòu),具體如圖4 所示。通過多個卷積核提取圖像不同尺度的特征,最后進行融合,這樣能夠獲得更好的圖像特征。并且,在Inception V2 結(jié)構(gòu)中,用兩個3×3 的結(jié)構(gòu)代替了5×5 的結(jié)構(gòu),在保持感受野不變的情況下,縮減了運算的參數(shù),提高了運算的性能。

圖4: Inception V3 結(jié)構(gòu)

受到VGG 與GoogleNet 網(wǎng)絡(luò)的啟發(fā),設(shè)計了如表1 所示的網(wǎng)絡(luò)結(jié)構(gòu),命名為VG-AMD。

表1: VG-AMD 網(wǎng)絡(luò)結(jié)構(gòu)

VG-AMD 網(wǎng)絡(luò)中,包含7 個卷積層,1 個全連接層,4 個池化層。7 個卷積層的目的是從眼底圖像中提取不同的特征,其中使用了2 個Inception-v2 模塊,代替普通的卷積層,其目的是提取更豐富的圖像特征。4 個池化層可以降低圖像的維度,最后一個池化層使用了平均池化,減少了網(wǎng)絡(luò)參數(shù)。卷積層的步長為1,池化層的步長為2,全連接層后接softmax 層,完成二分類的分類任務(wù),即眼底圖像正常與眼底圖像為黃斑變性兩類。由表1 可見,圖像的輸入大小為227×227×3,通過第一次卷積層后,圖像大小變?yōu)?25×225,通道數(shù)為16,然后經(jīng)過最大池化,降低圖像大小,變?yōu)?12×112。接著進行相同的卷積與池化操作,使圖像變?yōu)?2×22×256,并完成全局池化,輸入到全連接層,最后利用softmax 完成概率輸出。

4 實驗與結(jié)果分析

本實驗所提方法的實現(xiàn)是基于深度學(xué)習(xí)框架Pytorch 實現(xiàn)的,采用Adam 優(yōu)化算法,在一塊NVIDIA 3090GPU 上完成訓(xùn)練和測試。學(xué)習(xí)率設(shè)置為0.001,批次為100,批次大小設(shè)置為24,損失函數(shù)為交叉熵損失函數(shù)。實驗將數(shù)據(jù)分為訓(xùn)練集與測試集,訓(xùn)練集占80%,測試集占20%。經(jīng)過圖像預(yù)處理,共獲得1210 張正常眼底圖像,612 張AMD圖像,通過上述方法進行訓(xùn)練和測試,最終的結(jié)果如表2 所示。

表2: VG-AMD 網(wǎng)絡(luò)訓(xùn)練與測試結(jié)果

由表2 結(jié)果可知,VG-AMD 在測試集上的準(zhǔn)確率為93.1%,在訓(xùn)練集上的準(zhǔn)確率為94.2%,相差只有1.1%,VG-AMD 并不存在過擬合的現(xiàn)象。雖然VG-AMD 的識別率達到了93.1%,并且AUC 值達到了0.93,但是要想進一步提高VG-AMD 的性能,修改網(wǎng)絡(luò)結(jié)構(gòu)是一方面,數(shù)據(jù)樣本的數(shù)量也是比較關(guān)鍵的一個環(huán)節(jié),數(shù)據(jù)樣本的缺少,會造成網(wǎng)絡(luò)泛化性能的偏低。

5 總結(jié)

本文提出了一種以卷積網(wǎng)絡(luò)為基礎(chǔ)的自動化黃斑變性診斷技術(shù)。通過公開數(shù)據(jù)集收集了實驗所用圖像,并進行了相關(guān)的預(yù)處理和數(shù)據(jù)增強操作,然后經(jīng)過設(shè)計的VG-AMD 網(wǎng)絡(luò),可以自動的提取特征,并完成分類任務(wù),準(zhǔn)確率達到了93.1%,可以很好的作為醫(yī)生診斷的輔助工具。

猜你喜歡
變性黃斑濾波器
晉州市大成變性淀粉有限公司
從濾波器理解卷積
裂孔在黃斑
征兵“驚艷”
開關(guān)電源EMI濾波器的應(yīng)用方法探討
基于Canny振蕩抑制準(zhǔn)則的改進匹配濾波器
基于TMS320C6678的SAR方位向預(yù)濾波器的并行實現(xiàn)
變性淀粉在酸奶中的應(yīng)用
TA與Bevacizumab玻璃體腔注射治療BRVO黃斑水腫的對照研究
激光治療視網(wǎng)膜黃斑分支靜脈阻塞