卷積神經(jīng)網(wǎng)絡(luò)可視化

2019-12-04 03:18:55樊帆康兵義

電子技術(shù)與軟件工程 2019年12期

文/樊帆康兵義

1 人工智能時(shí)代的到來(lái)

在當(dāng)今社會(huì)中，互聯(lián)網(wǎng)已經(jīng)與我們的日常生活和學(xué)習(xí)緊密結(jié)合在一起，我們當(dāng)前處于互聯(lián)網(wǎng)的社會(huì)，而現(xiàn)在，我們又將迎接一個(gè)全新的時(shí)代——AI 的時(shí)代。在人工智能時(shí)代里，一切都將發(fā)生改變：通信方式，思維形式，甚至倫理道德都將與以往不同。人工智能是一門綜合各種學(xué)科各種專業(yè)且被用于模擬人類思維并自主學(xué)習(xí)的一門新興學(xué)科。隨著人工智能技術(shù)的進(jìn)一步成熟以及各行各業(yè)對(duì)于人工智能產(chǎn)業(yè)投入規(guī)模的日益增長(zhǎng)，人工智能與云計(jì)算的結(jié)合將不斷加速，全球人工智能產(chǎn)業(yè)規(guī)模在未來(lái)10年將進(jìn)入高速增長(zhǎng)期。咨詢公司埃森哲在有關(guān)人工智能進(jìn)化和分析領(lǐng)域報(bào)告中明確指出，預(yù)計(jì)到2035年，在人工智能領(lǐng)域深耕的國(guó)家的經(jīng)濟(jì)規(guī)模將到達(dá)一個(gè)難以想象的高度。2018年麥肯錫公司的研究報(bào)告預(yù)測(cè)，到2030年，約70%的公司將采用至少一種形式的人工智能，人工智能新增經(jīng)濟(jì)規(guī)模將達(dá)到一個(gè)新的高度。

2 卷積神經(jīng)網(wǎng)絡(luò)可視化的研究

2.1 理論背景

在人工智能蓬勃發(fā)展的各個(gè)領(lǐng)域中，最受人矚目的莫過(guò)于深度學(xué)習(xí)，而在深度學(xué)習(xí)的不同分類中，卷積神經(jīng)網(wǎng)絡(luò)則占了主導(dǎo)作用。卷積神經(jīng)網(wǎng)絡(luò)的定義是：具有一定深度表達(dá)的，包含卷積、池化等一系列計(jì)算的神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)仿造生物的視知覺(jué)(visual perception)機(jī)制構(gòu)建，可以進(jìn)行監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)，其隱含層內(nèi)的卷積核參數(shù)共享和層間連接的稀疏性使得卷積神經(jīng)網(wǎng)絡(luò)能夠以較小的計(jì)算量對(duì)格點(diǎn)化(grid-like topology)特征，例如像素和音頻進(jìn)行學(xué)習(xí)、有穩(wěn)定的效果且對(duì)數(shù)據(jù)沒(méi)有額外的特征工程(feature engineering)要求。

對(duì)卷積神經(jīng)網(wǎng)絡(luò)的研究始于二十世紀(jì)80至90年代，時(shí)間延遲網(wǎng)絡(luò)和LeNet-5 是最早出現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò)。在二十一世紀(jì)后，隨著深度學(xué)習(xí)理論的提出和數(shù)值計(jì)算設(shè)備的改進(jìn)，卷積神經(jīng)網(wǎng)絡(luò)不斷更迭自身基礎(chǔ)理論并得到了快速發(fā)展，在機(jī)器視覺(jué)，手寫(xiě)體識(shí)別，自然語(yǔ)言處理NLP 等方向得到了廣泛應(yīng)用。

神經(jīng)網(wǎng)絡(luò)可視化的理論基礎(chǔ)來(lái)自于2014年在ECCV 上的經(jīng)典論文：《Visualizing and Understanding Convolutional Networks》，作者首先介紹了CNN 在諸多領(lǐng)域取得的成功，并提出取得更好的成功的三種可能：

（1）更大的訓(xùn)練集；

（2）更加powerful 的GPU；

（3）更好的模型正則化策略( 如Dropout)。

接下來(lái)作者提出了上面提到的問(wèn)題，當(dāng)前仍然不能知道CNN 模型內(nèi)部是如何工作的，也不清楚到底學(xué)到了什么樣的特征，因此提出可以通過(guò)使用反卷積神經(jīng)網(wǎng)絡(luò)對(duì)網(wǎng)絡(luò)進(jìn)行可視化。最后通過(guò)AlexNet 的模型進(jìn)行可視化，并根據(jù)可視化結(jié)果對(duì)其進(jìn)行改進(jìn)，從而得到了更優(yōu)的結(jié)果。文獻(xiàn)中詳細(xì)的論述了CNN 網(wǎng)絡(luò)中每一層所學(xué)習(xí)到的特征，并將其可視化，同時(shí)描述了可視化的具體操作。

2.2 實(shí)施過(guò)程

首先搭建AlexNet 模型進(jìn)行實(shí)施過(guò)程前準(zhǔn)備，這是實(shí)施所必需的步驟，并研究卷積、池化、下采樣、全連接各層的算法實(shí)現(xiàn)，并對(duì)圖像進(jìn)行卷積、池化等處理以得到各層的特征圖；將特征圖進(jìn)行分類并裁剪成固定大小并保存在本地?cái)?shù)據(jù)庫(kù)或云數(shù)據(jù)庫(kù)中以備后用。

接著通過(guò)論文中的Deconvoluted 模型對(duì)AlexNet 中每一卷積、池化和全接連層生成一個(gè)大小相同且具有相反功能的神經(jīng)網(wǎng)絡(luò)層，在進(jìn)行反卷積過(guò)程中，記錄鄰近層在進(jìn)行卷積操作時(shí)輸出的數(shù)據(jù)位置和大小，并在反卷積層中相同位置填充相同大小的數(shù)據(jù)以進(jìn)行反卷積、反池化等算法，隨后對(duì)反卷積、反池化算法生成的圖像進(jìn)行微調(diào)以符合實(shí)驗(yàn)要求并還原出原始圖像，此時(shí)的圖像與原圖內(nèi)在差異度已經(jīng)很小，可用于后續(xù)操作的顯示。

最終，顯示所有還原的圖像，并根據(jù)原始圖像的類別對(duì)還原圖像進(jìn)行分類并分別顯示于卷積層、池化層、全連接等層。在顯示過(guò)程中，可根據(jù)使用習(xí)慣顯示多個(gè)層或單一層，以及在顯示微調(diào)過(guò)的圖片同時(shí)，探究卷積神經(jīng)網(wǎng)絡(luò)中每一個(gè)卷積核設(shè)置參數(shù)的調(diào)整對(duì)于輸入圖片分類精度的影響，最終實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的可視化。

3 總結(jié)

卷積神經(jīng)網(wǎng)絡(luò)長(zhǎng)期以來(lái)是圖像識(shí)別領(lǐng)域的核心算法之一，并在學(xué)習(xí)大量數(shù)據(jù)時(shí)有穩(wěn)定的表現(xiàn)。對(duì)于大規(guī)模圖像分類問(wèn)題，卷積神經(jīng)網(wǎng)絡(luò)可用于構(gòu)建階層分類器(hierarchical classifier) 或精細(xì)分類識(shí)別(fine-grained recognition)來(lái)用于提取圖像的判別特征以供其它分類器進(jìn)行學(xué)習(xí)；對(duì)于后者，特征提取可以人為地將圖像的不同部份分別輸入卷積神經(jīng)網(wǎng)絡(luò)，也可以由卷積神經(jīng)網(wǎng)絡(luò)通過(guò)非監(jiān)督學(xué)習(xí)自行提取。