孫運(yùn)文 徐秀林
摘 ?要:近年來隨著深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNN)的模型不斷完善,DNN在腫瘤的數(shù)字圖像識別方面精度越來越高,DNN受到了國內(nèi)外醫(yī)學(xué)界的廣泛研究和重視,DNN為識別良性腫瘤與惡性腫瘤的臨床診斷提供了客觀、準(zhǔn)確、快速、經(jīng)濟(jì)的解決方案。本文主要綜述了DNN技術(shù)在識別良性腫瘤與惡性腫瘤方向上使用的幾種常見分類器:卷積神經(jīng)網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)、深度殘差網(wǎng)絡(luò)和深度信念網(wǎng)絡(luò)。分析了這幾種分類器的原理及其應(yīng)用的效果,分析了基于不同神經(jīng)網(wǎng)絡(luò)分類器的精準(zhǔn)度和性能,提出了DNN的各種分類器在識別良性腫瘤與惡性腫瘤領(lǐng)域中面臨的問題及未來發(fā)展的趨勢。
關(guān)鍵詞:深度神經(jīng)網(wǎng)絡(luò);人工智能;分類器;腫瘤
中圖分類號:TP301 ? ? 文獻(xiàn)標(biāo)識碼:A
Research of Tumor Cell Classifier based on Deep Neural Network
SUN Yunwen, XU Xiulin
(School of Medical Instrument and Food Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China)
sunyunwen@foxmail.com; xxlin100@163.com
Abstract: In recent years, with the improvement of deep neural networks (DNN) models, the accuracy of digital image recognition of tumors has been improved continuously. DNN provides an objective, accurate, fast and economic solution for the clinical diagnosis of benign and malignant tumors. This technology has been widely studied and paid attention to by the medical community at home and abroad. This paper reviews several DNN classifiers (Convolution Neural Network, Generative Adversarial Network, Deep Residual Network, and Deep Belief Network), analyzes the accuracy and performance of these neural networks based on different classifiers, and forecast the future development trend of DNN classifiers.
Keywords: deep neural network; artificial intelligence; classifier; tumors
1 ? 引言(Introduction)
腫瘤按照生長方式的不同劃分為良性腫瘤與惡性腫瘤,兩者對人體的危害性和手術(shù)治療方法有非常大的區(qū)別,因此準(zhǔn)確識別良性腫瘤與惡性腫瘤有著巨大的臨床意義,惡性腫瘤發(fā)病例預(yù)計(jì)在2030年將達(dá)到2220萬例[1],惡性腫瘤毫無疑問已經(jīng)是人類的頭號大敵。
早期體檢篩查是最常見的發(fā)現(xiàn)惡性腫瘤的方法也是最有效預(yù)防惡性腫瘤的方法,目前診斷識別一個(gè)腫瘤是良性腫瘤還是惡性腫瘤的主要方法有如下兩種:病理診斷和影像診斷,病理診斷即活體組織檢查,活體穿刺對身體具有一定的傷害性,并且診斷時(shí)間較長。影像診斷良性腫瘤與惡性腫瘤的判斷依賴醫(yī)生的經(jīng)驗(yàn),觀察良性腫瘤和惡性腫瘤的電子計(jì)算機(jī)斷層掃描圖片(Computed Tomography, CT),兩者具有比較高的相似性,如圖1所示。不同的醫(yī)生得出的結(jié)論也有可能不同,耗費(fèi)患者大量的時(shí)間與精力。因此使用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNN)區(qū)分和診斷良性腫瘤與惡性腫瘤不僅節(jié)省了患者和醫(yī)生的時(shí)間,提高了醫(yī)療資源的效率,隨著識別的準(zhǔn)確度越來越高對臨床的意義也越來越重大,在醫(yī)學(xué)上的應(yīng)用具有很大潛力。分類器的選擇對于惡性腫瘤識別的準(zhǔn)確度有著很大的影響,本文將對近幾年常見的分類器進(jìn)行綜述。
2 ? DNN模型與應(yīng)用(DNN models and its application)
判斷一個(gè)腫瘤是否為惡性腫瘤是一個(gè)典型的二分類問題,在深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)領(lǐng)域中,期望計(jì)算機(jī)對于問題的答案能夠正確地回答,但是計(jì)算機(jī)通常不能給出直接正確的答案,所以通常采用0和1之間的識別率來計(jì)算。對于醫(yī)生來說,判斷CT圖片中的腫瘤是否為惡性腫瘤并不是一個(gè)確定的答案,醫(yī)生判斷惡性腫瘤不僅依賴CT圖片的清晰度和準(zhǔn)確度,還依賴于醫(yī)生個(gè)人的經(jīng)驗(yàn),但是DNN判斷惡性腫瘤則簡單的多,DNN可以讀取圖片的數(shù)字特征(如圖像的大小、通道數(shù)等),區(qū)分出良性腫瘤與惡性腫瘤CT圖片的區(qū)別。使用不同的DNN模型有著不同的優(yōu)勢和效果。
2.1 ? 卷積神經(jīng)網(wǎng)絡(luò)
Hubel和Wiesel在1962年發(fā)現(xiàn)貓和其他哺乳動(dòng)物的大腦視覺皮層中包含了多層細(xì)胞,每部分的細(xì)胞都有著不同的感知作用,通過電刺激不同部分的細(xì)胞會(huì)產(chǎn)生不同的視覺反應(yīng),這是計(jì)算機(jī)視覺的基礎(chǔ),Lecun等[2]對Hubel和Wiesel的研究加以改進(jìn),在神經(jīng)網(wǎng)絡(luò)中創(chuàng)造性的代入了傳播算法,并以此基礎(chǔ)構(gòu)建了卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)。2012年后Krizhesky等[3]利用圖形處理器(Graphics Processing Unit,GPU)強(qiáng)大的圖片處理性能開發(fā)了更為深層次的神經(jīng)網(wǎng)絡(luò)AlexNet,使CNN框架得到了進(jìn)一步的強(qiáng)化,如今CNN已經(jīng)有很多應(yīng)用在醫(yī)學(xué)影像的識別和處理上。并且經(jīng)過不斷的迭代優(yōu)化,已經(jīng)構(gòu)成很多以CNN為架構(gòu)的變化分類器[4]。CNN一般由三種不同類型的層組成:卷積層、池化層與全連接層。以LeNet-5CNN為例,LeNet-5CNN是由LeCun于1998年設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò),這個(gè)卷積神經(jīng)網(wǎng)絡(luò)基于梯度并且加入了反向傳播算法進(jìn)行了反監(jiān)督訓(xùn)練,這是最早的卷積神經(jīng)網(wǎng)絡(luò)原型。在常見的卷積神經(jīng)網(wǎng)絡(luò)中第一層卷積層的作用是從輸入的數(shù)據(jù)中抽象并利用設(shè)計(jì)好的算法提取數(shù)據(jù)的不同特征值。第一層卷積層的功能很簡單,主要提取形狀、線條、顏色等較為簡單的低層特征值,接下來需要更深的層次才能從低層特征中迭代提取更復(fù)雜的特征。第二層池化層(Pooling)從形式自上向下采樣,池化層提高了模型泛化能力,對圖像的識別范圍有了大大提高。全連接層的位置與普通神經(jīng)網(wǎng)絡(luò)中全連接層的位置相同,全連接層將上一層池化層自上向下采樣的神經(jīng)元信息與當(dāng)前的層進(jìn)行全連接生成全局特征信息,全連接層通常使用N維向量作為輸出,最終分類器或回歸方程分析N維向量并輸出最后的結(jié)果。
任湘等[5]在做關(guān)于乳腺癌分子分型預(yù)測時(shí)采用了新的方法,借助了深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了預(yù)測實(shí)驗(yàn),并且取得了很好的實(shí)驗(yàn)效果。在實(shí)驗(yàn)中他們依據(jù)乳腺癌分子分型為Luminal A、Luminal B、HER-2、Basal-like四種,他們使用了原始乳腺癌病灶區(qū)域的核磁共振成像(Magnetic Resonance Imaging,MRI),提取了這些MRI圖像以后他們對這些MRI又進(jìn)行了二次加工處理,使得CNN可以提取MRI的特征信息,隨后他們選擇CNN對其進(jìn)行卷積運(yùn)算,通過對CNN參數(shù)的優(yōu)化不斷提高了模型的精度。最后,他們使用訓(xùn)練集完成了最終的訓(xùn)練并對訓(xùn)練集的預(yù)測結(jié)果進(jìn)行了分析。實(shí)驗(yàn)結(jié)果表明,通過CNN對乳腺癌MRI進(jìn)行處理、提取特征和學(xué)習(xí),最后對乳腺癌的預(yù)測結(jié)果吻合度大于70%,實(shí)驗(yàn)表明CNN基本完成了預(yù)測任務(wù)。
CNN擅長多層分類,在多分類任務(wù)中CNN的準(zhǔn)確度明顯比其他分類器有更高的準(zhǔn)確度,CNN特有的多層堆疊、局部連接、權(quán)值共享和池化等特性其他分類器并不具有。所以一般的醫(yī)學(xué)圖像分類任務(wù),通常首選分類器為CNN。CNN的網(wǎng)絡(luò)構(gòu)架如圖2所示[6]。
2.2 ? 生成對抗網(wǎng)絡(luò)
2014年,Goodfellow等人[7]提出了生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks, GAN)。GAN的結(jié)構(gòu)由生成器和判別器組成,是在一個(gè)復(fù)雜分布上無監(jiān)督學(xué)習(xí)的分類器,雖然GAN擁有比較清晰和完善的邏輯架構(gòu),但是在一開始GAN對多層分類任務(wù)的識別準(zhǔn)確度并不高,此后研究人員的研究重點(diǎn)一直在提高GAN的準(zhǔn)確度[8],目前通過研究人員的不斷努力GAN已經(jīng)到達(dá)了一個(gè)比較高的完成度,GAN已經(jīng)是二分類任務(wù)中最有潛力的方法。
如圖3所示,GAN由兩大核心部分組成,分別為生成模型和判別模型,生成模型在不斷讀取數(shù)據(jù)源中的特征數(shù)據(jù),同時(shí)不斷學(xué)習(xí)數(shù)據(jù)源中的特征信息,然后生成偽樣本,偽樣本的功能是混淆判別模型。而判別模型通過學(xué)習(xí)真實(shí)樣本和偽樣本的差異,分析出規(guī)律。生成模型和判別模型不斷交流的過程就是數(shù)據(jù)不斷生成和對抗的過程。GAN的優(yōu)勢在于訓(xùn)練樣本不足的情況下,仍然能有效分辨出原有數(shù)據(jù)的分布規(guī)律。
GAN的判別率很大程度上依賴樣本集的數(shù)量和質(zhì)量,其中樣本集的數(shù)量尤其重要,數(shù)據(jù)量很大的樣本集即使質(zhì)量不是很高,GAN也可以慢慢自我學(xué)習(xí)強(qiáng)化,達(dá)到訓(xùn)練的目的,數(shù)量的優(yōu)勢可以大大彌補(bǔ)樣本集質(zhì)量的不足。一般普遍認(rèn)為在處理圖像分類任務(wù)的時(shí)候使用GAN相比于其他分類器并沒有展現(xiàn)出很大的優(yōu)勢,但是在圖像生成、圖像優(yōu)化方面GAN時(shí)相比于其他分類器具有獨(dú)一無二的價(jià)值。所以在分辨腫瘤細(xì)胞是否為惡性腫瘤的時(shí)候GAN是一個(gè)繞不開的分類器,當(dāng)現(xiàn)有的腫瘤CT圖片清晰度不高的時(shí)GAN無疑是一個(gè)很好的選擇。GAN可以彌補(bǔ)圖像質(zhì)量不高的特性還使得GAN在圖像超分辨率領(lǐng)域成為首選分類器,Lin等[9]提出了由密集連接的深卷積層發(fā)生器網(wǎng)絡(luò)和鑒別器組成生成對抗網(wǎng)絡(luò)框架的SR無監(jiān)督學(xué)習(xí)方法,該方法的正確運(yùn)行證明了無監(jiān)督學(xué)習(xí)的單圖像SR算法的可行性和有效性。
GAN分類器在按種類分辨圖像方面略顯劣勢,但其學(xué)習(xí)圖像、圖像優(yōu)化方面遠(yuǎn)遠(yuǎn)領(lǐng)先其他分類器,在臨床上也占據(jù)了一席之地。判別腫瘤是否為惡性腫瘤是一個(gè)典型的二分類問題,GAN的判別模型也是一個(gè)典型的二分類模型,所以非常適合使用GAN來診斷和識別良性腫瘤與惡性腫瘤。
2.3 ? 深度殘差網(wǎng)絡(luò)
將候選區(qū)域方法與CNN方法結(jié)合起來可得到精細(xì)的分割邊界,并可以進(jìn)行端到端訓(xùn)練。在Caesar等人[10]方法的基礎(chǔ)上,結(jié)合HE Kaiming等人[11]提出的深度殘差網(wǎng)絡(luò)(Deep Residual Networks, DRN),得出一種基于區(qū)域和DRN的語義分割方法。DRN在候選區(qū)域使用生成算法在原始數(shù)據(jù)的基礎(chǔ)上生成了數(shù)量龐大的候選數(shù)據(jù),然后通過DRN特有的自由形狀ROI池化層,抽象數(shù)據(jù)并分類最終提取多維度的特征數(shù)據(jù),并在最終階段進(jìn)行融合。然后使用帶擴(kuò)張卷積的DRN進(jìn)行特征提取,并使用全局平均池化層對每一個(gè)像素分類,得到最終的分割結(jié)果。
圖4是一種結(jié)合區(qū)域和深度殘差網(wǎng)絡(luò)的語義分割模型[12]。網(wǎng)絡(luò)分為三個(gè)部分,第一部分生成候選區(qū)域,第二部分是全卷積網(wǎng)絡(luò),該部分使用殘差網(wǎng)絡(luò)模型中前部分卷積層作為基礎(chǔ)網(wǎng)絡(luò),利用擴(kuò)張率的不同在最后卷積層得到特征圖。第三部分為分割網(wǎng)絡(luò),輸入第一部分生成的候選區(qū)域和第二部分得到的特征圖,輸出分割圖像。
DRN在復(fù)雜的臨床任務(wù)中較好地解決了梯度爆炸、梯度消失等問題,在分辨腫瘤細(xì)胞是否為惡性腫瘤時(shí)把DRN作為基礎(chǔ)的分類器是一個(gè)不錯(cuò)的選擇,同時(shí)DRN特殊的框架對其他DNN模型具有指導(dǎo)意義,研究人員正在致力于將DRN框架擴(kuò)展到其他DNN模型,如果成功其他DNN模型將得到更為精確的預(yù)測結(jié)果。
2.4 ? 深度信念網(wǎng)絡(luò)
2006年,Hinton[13]提出了一種用多層網(wǎng)絡(luò)限制Boltzmann機(jī)器(Restricted Boltzmann Machine,RBM)堆棧降維的方法,實(shí)現(xiàn)了無監(jiān)督的自動(dòng)特征學(xué)習(xí)。Hinton[14]又在此基礎(chǔ)上增加線性分類器,無監(jiān)督特征學(xué)習(xí)加上線性分類器,就形成了我們現(xiàn)在一般認(rèn)為的深度信念網(wǎng)絡(luò)模型(Deep Belief Network, DBN)的前身,現(xiàn)在一般DBN是一個(gè)由若干個(gè)RBM和一個(gè)BP(Back Propagation, BP)神經(jīng)網(wǎng)絡(luò)組成的分類器。DBN對輸入的數(shù)據(jù)進(jìn)行數(shù)據(jù)化處理,然后將RBM提取的特征信息輸入到BP神經(jīng)網(wǎng)絡(luò),通過有監(jiān)督的BP神經(jīng)網(wǎng)絡(luò)將誤差反向傳播,自上向下微調(diào)整個(gè)DBN模型[15]。DBN的模型圖如圖5所示[16]。
DBN訓(xùn)練一般分為兩個(gè)階段[17],分別是逐層預(yù)訓(xùn)練階段和自上向下精調(diào)階段。在逐層預(yù)訓(xùn)練階段,DBN從最底層開始自下而上訓(xùn)練每一層RBM網(wǎng)絡(luò),這種自下而上的方法可以慢慢地在每一層起到堆棧降維的作用,預(yù)訓(xùn)練使分類器可以更多的提取數(shù)據(jù)的特征值,特征值的提取質(zhì)量越好對預(yù)測結(jié)果越有幫助。在整體自上向下精調(diào)階段,分類器在BP神經(jīng)網(wǎng)絡(luò)中輸入在上一層池化層中抽象提取的特征信息和特征向量,利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行有監(jiān)督的訓(xùn)練,最后根據(jù)結(jié)果加入?yún)?shù)代入計(jì)算,使預(yù)測結(jié)果變得最準(zhǔn)確。
DBN具有高度靈活性,臨床上的應(yīng)用也十分靈活,相比于其他分類器,DBN擁有更快的訓(xùn)練速度和更少的學(xué)習(xí)時(shí)間,在分辨良性腫瘤與惡性腫瘤的方面具有很大的潛力。
3 ? 結(jié)論(Conclusion)
隨著計(jì)算機(jī)技術(shù)和人工智能技術(shù)的發(fā)展,硬件的物理速度不斷提高,神經(jīng)網(wǎng)絡(luò)的模型不斷完善,借助DNN對良性腫瘤和惡性腫瘤進(jìn)行區(qū)分已經(jīng)是勢不可擋的趨勢。目前DNN分類器在分辨良性腫瘤和惡性腫瘤方面存在兩個(gè)主要問題:(1)由于硬件條件和計(jì)算資源的限制,DNN的訓(xùn)練時(shí)間過長,學(xué)習(xí)速度比較慢。(2)由于訓(xùn)練樣本和模型深度的限制,DNN的精確度和識別率還不夠貼近真實(shí)樣本,不同的圖像質(zhì)量也對識別率有著很大的影像。
如何解決這兩個(gè)問題是應(yīng)用DNN在腫瘤識別領(lǐng)域的關(guān)鍵,根據(jù)摩爾定律,計(jì)算機(jī)硬件的飛速發(fā)展將極大減少DNN的訓(xùn)練時(shí)間,第一個(gè)問題將得到解決。解決第二個(gè)問題的關(guān)鍵是分類器的深度和成熟度,目前研究人員的主要研究方向是研究和開發(fā)新的層次模型并優(yōu)化算法來得到更精確的識別率。相信隨著網(wǎng)絡(luò)層次的加深,分類器的構(gòu)架變得完善,模型的精度將會(huì)不斷提高,DNN在區(qū)分良性腫瘤和惡性腫瘤方面將擁有更好的識別率。
應(yīng)用DNN分類器對腫瘤進(jìn)行提前篩查,做到早預(yù)防、早治療,不僅能提高患者的生存質(zhì)量和生存率,而且大大提高了醫(yī)生的效率,防止了患者病情的惡化,為病人提供了準(zhǔn)確的治療方案,降低了誤診率,緩解了醫(yī)療資源不足的問題,具有重要的臨床意義。
參考文獻(xiàn)(References)
[1] ALLEMANI C, MATSUDAT. Analysis of individual records for 37513025 patients diagnosed with one of 18 cancers[J]. Lancet, 2018, 391(17): 1023-1075.
[2] LECUNY, BENGIOY, HINTONG. Deep learning[J]. Nature, 2015(521): 436-444.
[3] KRIZHESKYA, SUTSKEVERI, HINTONGE. Image Net classification with deep convolutional neural networks[C]. 2012: 1097-1105.
[4] KUMARAN, VERMAR. Convolutional neural networks for wavelet domain super resolution[J]. Pattern Recognit Lett, 2017(90): 65-71.
[5] 任湘,張朋,范明,等.基于卷積神經(jīng)網(wǎng)絡(luò)的乳腺癌分子分型預(yù)測研究[J].杭州電子科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,38(05):66-71.
[6] ZHANG J J, SHAO K. Small sample image recognition using improved convolutional neural network[J]. J Vis Commun Image Represent, 2018(55): 640-647.
[7] GoodfellowIJ, PougetAbadieJ, MirzaM, et al. Generativeadversarialnets[C]. Proc of the 27th Int Confon Neural Information Processing Systems. Cambridge, MA: MITPress, 2014(06): 2672-2680.
[8] Salimans T, Goodfellow I. Zaremba W, et al. Improved techniques for training gans[J]. arXivpreprint, 2016(01): ?2226-2234.
[9] LING M, WU QX. Deep unsupervised learning for image super resolution with generative adversarial network[J]. Signal Process: Image, 2018(08): 88-100.
[10] CAESAR H, UIJLINGS J, FERRARI V. Region-based semantic segmentation with end-to-endtraining[C]. Proceedings of the 14th European Conference on Computer Vision 2016, Amsterdam, The Netherlands, 2016(01): 381-397.
[11] HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Deep residual learning for image recognition[C]. Proceedings of 2016 IEEE Conference on Computer Vision and Pattern. Recognition, LasVegas, USA, 2016, 39(6): 770-778.
[12] Luo Huilan, Lu Fei, Kong Fansheng. Image semantic segmentation based on region and depth residual network[J]. Journal of electronics and information, 2019, 41 (11): 2777-2786.
[13] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.
[14] Hinton G E, Osindero S, Teh Y W. ?A fast learning algorithm for deep belief nets[J]. Neural Comp, 2006, 18(7): 1527-1554.
[15] Aliya. Aierken, Halidan. Abudureyimu, et al. A Uyghur span classification method based on deep belief networks[J]. Computer Engineering & Science, 2016, 10(10): 2134-2139.
[16] Shi Ke, Lu Yang, Liu Guangliang, Bi Xiang, et ?al. Deep belief network training method based on multi hidden layer Gibbs sampling[J]. Acta automatica Sinica, 2019, 45(05): 975-984.
[17] 趙文迪,陳德旺,卓永強(qiáng),等.深度神經(jīng)模糊系統(tǒng)算法及其回歸應(yīng)用[J/OL].自動(dòng)化學(xué)報(bào),2020,46(8):1557-1570.
作者簡介:
孫運(yùn)文(1996-),男,碩士生.研究領(lǐng)域:醫(yī)學(xué)信息學(xué).
徐秀林(1957-),女,博士,教授.研究領(lǐng)域:康復(fù)設(shè)備與骨科器械,醫(yī)學(xué)信息學(xué).