国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的肺結(jié)節(jié)檢測

2018-02-27 20:07孟以爽易平顧問郭雪君
計(jì)算機(jī)時代 2018年2期
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)

孟以爽+易平+顧問+郭雪君

摘 要: 肺結(jié)節(jié)的檢測是一項(xiàng)非常重要的計(jì)算機(jī)輔助診斷工作。文章提出了一種多片染色重疊圖像處理方法,來增強(qiáng)肺結(jié)節(jié)與其他健康組織間的差異性,并基于深度學(xué)習(xí)算法進(jìn)行肺結(jié)節(jié)檢測實(shí)驗(yàn)。實(shí)驗(yàn)使用了LIDC-IDRI數(shù)據(jù)集中的10000張肺部健康組織ROI和12000張肺結(jié)節(jié)ROI作為訓(xùn)練樣本集,使用AlexNet卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的算法網(wǎng)絡(luò),通過LIDC數(shù)據(jù)庫中176個病人的CT圖像測試,得到了95.0%的敏感性和平均5.62的假陽性率結(jié)果。實(shí)驗(yàn)結(jié)果表明,所提出的方法比特征提取方法等傳統(tǒng)方法能提高肺結(jié)節(jié)的檢出率。

關(guān)鍵詞: 計(jì)算機(jī)輔助診斷; 深度學(xué)習(xí); 肺結(jié)節(jié); 卷積神經(jīng)網(wǎng)絡(luò)

中圖分類號:TP391 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2018)02-05-05

Abstract: The detection of pulmonary nodules is a very important part of computer-aided diagnosis. In this paper, a method of multi-slices coloring and superposition is proposed to increase the difference between pulmonary nodules and other healthy tissues and detect the nodules based on deep learning. The experiment uses 10000 patches of healthy tissues and 12000 patches of pulmonary nodules in LIDC-IDRI dataset as training dataset and AlexNet convolutional neural network as deep learning network. The prediction model after training is tested on 176 patients' CT images and gains the sensitive of 95.0% and an average of 5.62 false positive rates. The experimental results show that the proposed method can improve the detection rate of pulmonary nodules compared with some traditional feature extraction methods.

Key words: computer-aided diagnosis; deep learning; pulmonary nodules; convolutional neural network

0 引言

肺結(jié)節(jié)很有可能是早期肺癌的一個標(biāo)志,而肺癌是新發(fā)率和致死率最高的癌癥之一,因此近幾年肺結(jié)節(jié)已引起廣泛的注意[1-3]。傳統(tǒng)檢測肺結(jié)節(jié)的方法為通過醫(yī)師觀察肺部的CT切片圖像,并識別病人是否有肺結(jié)節(jié)。然而較微小的肺結(jié)節(jié)在CT影像上看與血管較為相似,易被遺漏,通常一個病人的完整CT圖像有數(shù)百張的切片,因此,對計(jì)算機(jī)輔助檢測的研究就顯得尤為重要[4]。目前,對肺結(jié)節(jié)的計(jì)算機(jī)輔助診斷多使用特征提取分析的方法。近年來,深度學(xué)習(xí)已經(jīng)成為了機(jī)器學(xué)習(xí)中一個非常關(guān)鍵的研究領(lǐng)域,并在各個方向的研究中不斷取得新的成就[5-7]。本文提出了一種使用多切片染色的預(yù)處理方法,并使用深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練了大量的CT切片數(shù)據(jù),得到了一個預(yù)測模型來進(jìn)行CT切片是否含有肺結(jié)節(jié)的檢測工作。

1 相關(guān)工作

深度學(xué)習(xí)的概念由Hilton于2006年在Science上提出,以區(qū)別于人工神經(jīng)網(wǎng)絡(luò)算法[8]。卷積神經(jīng)網(wǎng)絡(luò)是一種常用于圖像識別和圖像處理的深度學(xué)習(xí)算法,諸如人臉識別領(lǐng)域[9],行人檢測領(lǐng)域[10]等各個圖像相關(guān)領(lǐng)域,具有局部感知和權(quán)值共享等特點(diǎn)。通過局部感知的方式,神經(jīng)元可以提取出圖像的一些特征,例如方向、角點(diǎn)等,而權(quán)值共享這一機(jī)制使得卷積神經(jīng)網(wǎng)絡(luò)算法可以減少參數(shù)的數(shù)量。卷積神經(jīng)網(wǎng)絡(luò)算法還使用降采樣的方法來減少特征的規(guī)模。

卷積神經(jīng)網(wǎng)絡(luò)的主要組成部分為卷積層、池化層和全連接層。卷積層使用卷積核對圖像進(jìn)行卷積操作,來學(xué)習(xí)并獲得圖像的一些特征。池化層常被安排在卷積層之后,負(fù)責(zé)提取圖像的主要特征并進(jìn)行特征壓縮。使用池化層的主要目的是減少數(shù)據(jù)的規(guī)模和計(jì)算負(fù)荷,并降低算法的復(fù)雜度。全連接層則負(fù)責(zé)將提取到的特征映射到輸出樣本空間。

2 肺結(jié)節(jié)的檢測

本文的主要研究方法是通過AlexNet深度卷積神經(jīng)網(wǎng)絡(luò)算法來對預(yù)處理后的數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)預(yù)處理共有三個步驟,分別為:肺實(shí)質(zhì)的提取、感興趣區(qū)域的提取和感興趣區(qū)域的疊加操作。

2.1 肺實(shí)質(zhì)的提取

數(shù)據(jù)預(yù)處理的第一步為肺實(shí)質(zhì)的提取。由于我們只對肺部CT圖像中的肺實(shí)質(zhì)部分感興趣,所以我們從原始CT切片圖像中提取出肺實(shí)質(zhì)來進(jìn)行分析,這樣就可以有效減少肺部輪廓對實(shí)驗(yàn)結(jié)果的影響。在肺實(shí)質(zhì)提取的過程中,我們采取了肺部輪廓腐蝕的方法來盡量粘連在肺部輪廓上的候選肺結(jié)節(jié)與肺部輪廓分割開。

肺實(shí)質(zhì)提取的詳細(xì)步驟為:①將原始肺部CT切片通過固定閾值二值化,并轉(zhuǎn)換為一個二值圖像;②提取出二值圖像中的最大連通分量,并將其視為初步提取的肺部輪廓;③通過將較小的黑色連通區(qū)域置為白色的方法填補(bǔ)上氣管和一些小的空洞;④對肺部輪廓進(jìn)行腐蝕操作,來將粘連在肺部輪廓上的候選結(jié)節(jié)與其分割開;⑤填補(bǔ)上一些較小的空洞,并對肺部輪廓使用上一步驟的腐蝕操作中相同的操作算子進(jìn)行膨脹操作,得到最終的肺部輪廓;⑥通過該輪廓得到肺實(shí)質(zhì)的掩模;⑦通過肺實(shí)質(zhì)掩模從原始的CT切片圖像中提取出肺實(shí)質(zhì)。肺實(shí)質(zhì)提取具體步驟的一個例子如圖1所示。endprint

2.2 感興趣區(qū)域(ROI)的提取

數(shù)據(jù)預(yù)處理的第二個步驟是ROI的提取。在得到了肺實(shí)質(zhì)之后,我們對肺實(shí)質(zhì)進(jìn)行分析,并獲得候選肺結(jié)節(jié)的質(zhì)心位置。我們對肺實(shí)質(zhì)圖像以候選肺結(jié)節(jié)的質(zhì)心為中心,切割出64×64的小塊圖像,即為肺實(shí)質(zhì)的ROI。

ROI提取的步驟為:①將肺實(shí)質(zhì)轉(zhuǎn)化為二值圖像來進(jìn)行進(jìn)一步的分析;②刪除一些極小面積的干擾區(qū)域;③由于肺結(jié)節(jié)一般都是近似于球狀的,刪除一些明顯的條狀區(qū)域(即長寬比過于懸殊的區(qū)域);④將圖像上仍然遺留的白色連通區(qū)域視為候選肺結(jié)節(jié),并以候選肺結(jié)節(jié)的質(zhì)心為中心,從肺實(shí)質(zhì)中切割出64×64的小塊圖像,并將其視為感興趣區(qū)域。ROI提取具體步驟的一個例子如圖2所示。

2.3 感興趣區(qū)域的疊加

數(shù)據(jù)預(yù)處理的最后一個步驟為ROI小塊圖像的疊加操作。當(dāng)我們獲得肺實(shí)質(zhì)的ROI區(qū)域以后,我們從按切片深度排序的CT切片序列中,找到上一張與下一張切片與其相應(yīng)的肺實(shí)質(zhì),并從肺實(shí)質(zhì)中切割出與ROI同一位置的64×64小塊圖像。將這三張小塊圖像依次放入RGB通道(紅色,綠色,藍(lán)色通道)疊加,最終得到一張64×64的偽彩圖。這些64×64的偽彩圖將被作為后續(xù)深度學(xué)習(xí)的訓(xùn)練和測試樣本集。

感興趣區(qū)域的疊加操作的目的是增強(qiáng)肺結(jié)節(jié)和其他健康組織之間的差異性。由于肺結(jié)節(jié)的球狀特征,連續(xù)三張CT切片上得到的小塊圖像中的候選肺結(jié)節(jié)幾乎重疊。然而諸如血管之類的健康組織大多呈條狀,因此,疊加后的偽彩圖上能看到明顯的紅、綠、藍(lán)色的漸變,顯示出健康組織在縱向上呈條狀的走向。

對于一些尺寸較小,肉眼識別較為困難的肺結(jié)節(jié),通過這一預(yù)處理操作能夠非常有效地增加肺結(jié)節(jié)與血管之間的差別。一些典型的肺結(jié)節(jié)偽彩圖和健康組織偽彩圖的樣本如圖3所示。

2.4 深度學(xué)習(xí)模型

本文使用Caffe(Convolutional Architecture for Fast Feature Embedding)作為深度學(xué)習(xí)的框架。Caffe由伯克利視覺與學(xué)習(xí)中心(Berkeley Vision and Learning Center,BVLC)開發(fā),可用于作為卷積神經(jīng)網(wǎng)絡(luò)的平臺[11]。Caffe有著運(yùn)行速度快與可擴(kuò)展等特性。實(shí)驗(yàn)使用服務(wù)器的操作系統(tǒng)為CentOS 7.3,GPU顯卡為NVIDIA GeForce GTX 1080。

數(shù)據(jù)集的訓(xùn)練工作通過AlexNet完成。AlexNet是一種經(jīng)典的開源卷積神經(jīng)網(wǎng)絡(luò)算法,曾獲得2012年ImageNet視覺識別比賽的冠軍(ImageNet Large Scale Visual Recognition Challenge,ILSVR)。AlexNet由五個卷積層,三個池化層,三個全連接層和七個激活層組成,有近六千萬的自由參數(shù)。AlexNet網(wǎng)絡(luò)的結(jié)構(gòu)如圖4。

模型的初始學(xué)習(xí)率為0.01,以每10000次迭代10的因子衰減。迭代的最大次數(shù)為100000次,動量系數(shù)為0.9,衰減權(quán)值為0.0005。在完成了最大迭代步數(shù)的訓(xùn)練以后,我們得到了一個模型,來進(jìn)行每張偽彩色小塊圖像中是否含有肺結(jié)節(jié)的判別工作。

3 實(shí)驗(yàn)結(jié)果

本文使用LIDC-IDRI(Lung Image Database Consortium)數(shù)據(jù)庫作為訓(xùn)練和測試的肺部CT切片樣本集。LIDC-IDRI數(shù)據(jù)庫由美國國家癌癥協(xié)會(National Cancer Institute,NCI)為了早期癌癥的研究而收集與公布[12]。LIDC-IDRI數(shù)據(jù)庫是一個規(guī)模較大,被最為廣泛使用的肺部CT圖像數(shù)據(jù)庫,包含有1007個病人的完整肺部CT切片圖像及其標(biāo)注信息,包括肺結(jié)節(jié)所在位置、大小與一些其他的特征。

我們使用800個病人的CT圖像中提取出的10000張肺結(jié)節(jié)偽彩小塊圖像與12000張健康組織偽彩小塊圖像作為訓(xùn)練數(shù)據(jù)樣本集。通過深度學(xué)習(xí)的模型對數(shù)據(jù)的學(xué)習(xí)和分析,最終訓(xùn)練得到一個預(yù)測模型。實(shí)驗(yàn)使用不在訓(xùn)練集中的另外176個病人的CT圖像作為測試集,對模型進(jìn)行了測試。測試集中共有321個肺部結(jié)節(jié)。根據(jù)不同肺結(jié)節(jié)大小得到的實(shí)驗(yàn)結(jié)果如表1所示,可以發(fā)現(xiàn)未被檢出的肺結(jié)節(jié)尺寸均小于10mm。根據(jù)不同肺結(jié)節(jié)位置得到的實(shí)驗(yàn)結(jié)果如表2所示,實(shí)驗(yàn)結(jié)果表明不與肺部輪廓粘連的肺結(jié)節(jié)檢出率高于與肺部輪廓粘連的肺結(jié)節(jié)檢出率。

當(dāng)預(yù)測模型分析輸入的測試圖像后,會輸出一個0至1之間的數(shù)值,該值表現(xiàn)測試圖像中含有肺結(jié)節(jié)的概率。通過設(shè)置一個閾值可以對測試圖像進(jìn)行是否含有肺結(jié)節(jié)的區(qū)分。同一閾值下,敏感性和假陽性的ROC曲線如圖5所示。當(dāng)閾值為0.5時,預(yù)測模型的表現(xiàn)較好。

本文算法的實(shí)驗(yàn)結(jié)果與其他CAD系統(tǒng)的實(shí)驗(yàn)結(jié)果比較如表3所示。這些CAD系統(tǒng)中,一半使用的是LIDC-IDRI數(shù)據(jù)庫。從實(shí)驗(yàn)結(jié)果看出,本文提出的方法得到的檢出率高于一些其他的CAD 系統(tǒng),假陽性能夠低于一些傳統(tǒng)的檢測方法。

4 結(jié)論

通過本文提出的基于深度學(xué)習(xí)的多切片染色方法進(jìn)行肺結(jié)節(jié)檢測實(shí)驗(yàn),我們得到了95.0% 的高敏感性與平均5.62的假陽性。實(shí)驗(yàn)結(jié)果表明通過本方法可以有效地提高肺結(jié)節(jié)的檢出率。本方法還適用于一些粘連在肺部輪廓上的結(jié)節(jié)和一些尺寸較小的結(jié)節(jié),因此具有較高的普適性。未來,我們將繼續(xù)在假陽性的降低和肺結(jié)節(jié)的分類(例如GGO結(jié)節(jié)與非GGO結(jié)節(jié)的區(qū)分)上開展研究。

參考文獻(xiàn)(References):

[1] Nie S D, Li-Hong L I, Chen Z X. A CI feature-based pulmonary nodule segmentation using three-domain mean shift clustering[C]// International Conference on Wavelet Analysis and Pattern Recognition. IEEE,2008:223-227endprint

猜你喜歡
卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)
基于卷積神經(jīng)網(wǎng)絡(luò)溫室智能大棚監(jiān)控系統(tǒng)的研究
基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識別算法
有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于卷積神經(jīng)網(wǎng)絡(luò)的樹葉識別的算法的研究
永吉县| 从化市| 外汇| 北宁市| 秦皇岛市| 永州市| 岱山县| 海晏县| 广东省| 阜宁县| 海南省| 浮山县| 沅江市| 布拖县| 原平市| 安丘市| 兴仁县| 张家口市| 兴安盟| 青冈县| 温州市| 广丰县| 宝丰县| 孙吴县| 天津市| 雷山县| 东丰县| 和硕县| 武隆县| 祁阳县| 平陆县| 中山市| 呼伦贝尔市| 塘沽区| 马山县| 阿克陶县| 玉山县| 开封市| 虹口区| 龙游县| 辽源市|