国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

深度學(xué)習(xí)在圖像識別中的研究與應(yīng)用

2020-07-12 07:38
科技視界 2020年24期
關(guān)鍵詞:圖像識別人臉識別特征提取

王 顥

0 引言

隨著信息技術(shù)的快速發(fā)展,圖像的數(shù)量呈指數(shù)型增長,圖像識別技術(shù)可以智能、高效地完成海量圖像的分類與識別,因此,圖像識別一直是計算機(jī)視覺領(lǐng)域的研究熱點。近年來,深度學(xué)習(xí)技術(shù)的應(yīng)用范圍日益擴(kuò)大,將深度學(xué)習(xí)應(yīng)用到圖像識別領(lǐng)域已成為新的研究方向。

1 圖像識別

隨著網(wǎng)絡(luò)信息技術(shù)的發(fā)展,各類社交軟件正逐漸成為人們獲取信息、保持與他人聯(lián)絡(luò)的必備手段。在這些社交軟件中,圖片由于不會受到語言和文字等地域文化的約束,正在逐漸取代傳統(tǒng)的文字信息表達(dá)方式。

圖像識別技術(shù)能夠智能的提取圖像特征、完成圖像分類,現(xiàn)已應(yīng)用到醫(yī)療、交通、安防等各類生活場景中。圖像識別一般包括圖像預(yù)處理、圖像特征提取和圖像分類三個步驟。圖像預(yù)處理是通過去除圖像中的噪聲和干擾,增強(qiáng)有用信息,來提高圖像識別的準(zhǔn)確率。圖像的特征提取是將圖像轉(zhuǎn)化為“非圖像”的描述,比如數(shù)值表示或向量描述等,其基本思想是將高維空間中的原始圖像映射或變換為低維特征描述。圖像識別是以提取到的圖像特征為基礎(chǔ),根據(jù)分類決策,得到待識別圖像所屬的類別。

2 深度學(xué)習(xí)

深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種,其概念源自人工神經(jīng)網(wǎng)絡(luò)(ANN),人工神經(jīng)網(wǎng)絡(luò)從信息處理角度模擬了人腦的神經(jīng)元之間傳遞和處理信息的模式。2006年,Hinton[1]等人提出深度學(xué)習(xí)的概念,它是一種包含多隱藏層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),能夠更加抽象、更深層次地描述目標(biāo)對象的特征。

深度學(xué)習(xí)一般可以分成有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),分類的依據(jù)是數(shù)據(jù)是否含有標(biāo)記。有監(jiān)督學(xué)習(xí)過程中會找出訓(xùn)練數(shù)據(jù)的特征與標(biāo)記之間的映射關(guān)系,并且通過標(biāo)記不斷糾正學(xué)習(xí)過程中的偏差,不斷提高學(xué)習(xí)的預(yù)測率。有監(jiān)督學(xué)習(xí)主要有卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和深度堆疊網(wǎng)絡(luò)(DSN)。無監(jiān)督學(xué)習(xí)的訓(xùn)練數(shù)據(jù)沒有標(biāo)記,常用的算法有受限玻爾茲曼機(jī)(RBM)、深度置信網(wǎng)絡(luò)(DBN)等。

2.1 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)的重要組成部分,也是圖像識別領(lǐng)域中應(yīng)用較為廣泛的模型之一,CNN模型的優(yōu)點主要在于避免了對圖像處理前期過程中大量的特征提取工作,簡化了圖像預(yù)處理的步驟。CNN模型是以圖像的局部關(guān)聯(lián)性和特征重復(fù)性為假設(shè)條件,即假設(shè)圖像某一點的像素一般與其相鄰像素的關(guān)聯(lián)性較大,與其他像素的關(guān)聯(lián)性較小,避免了全連接所必需的大量參數(shù),這就是CNN的局部連接特性。

2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)

循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)是針對序列數(shù)據(jù)問題而設(shè)計的,RNN在網(wǎng)絡(luò)模型中引入了定性循環(huán)的概念,信號在兩個神經(jīng)元之間傳遞之后并不會立刻消失。與卷積神經(jīng)網(wǎng)絡(luò)不同的是,循環(huán)神經(jīng)網(wǎng)絡(luò)中隱藏層神經(jīng)元的輸入不僅包含了上一層神經(jīng)元的輸出,也包含了前一時刻該隱藏層神經(jīng)元的輸出。RNN是具有記憶功能的網(wǎng)絡(luò)模型,適合處理序列數(shù)據(jù),因為序列數(shù)據(jù)具有很強(qiáng)的關(guān)聯(lián)性,前面的數(shù)據(jù)對后面的數(shù)據(jù)有很大的影響[3]。

2.3 生成式對抗網(wǎng)絡(luò)

生成式對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)是由Ian Goodfellow等人于2014年提出的一種無監(jiān)督模型,GAN在對抗過程中估計并生成模型[4]。GAN打破了傳統(tǒng)生成算法的模式,采用博弈方式來優(yōu)化兩個模型,即生成模型G和判別模型D。生成模型G捕捉真實樣本數(shù)據(jù)的分布,并生成新的數(shù)據(jù)樣本。判別模型D是一個二分類器,估計一個輸入樣本來自訓(xùn)練樣本的概率。與傳統(tǒng)的生成算法相比,GAN只用到反向傳播,與之前的馬爾可夫鏈模式相比效率更高。而且,GAN的損失函數(shù)與傳統(tǒng)的均方誤差相比更加嚴(yán)謹(jǐn),因此GAN在圖像處理和計算機(jī)視覺領(lǐng)域取得了廣泛的應(yīng)用。

3 深度學(xué)習(xí)在圖像識別中的應(yīng)用

深度學(xué)習(xí)具有特征提取能力強(qiáng)、實時性快、識別精度高的優(yōu)點。目前,深度學(xué)習(xí)已經(jīng)廣泛應(yīng)用于圖像識別領(lǐng)域的各個方面。

3.1 人臉識別

人臉識別技術(shù)是根據(jù)人臉的特征信息完成身份識別的一種生物智能識別技術(shù)。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,基于深度學(xué)習(xí)的人臉識別技術(shù)已成為學(xué)者們研究的熱點[5]?;谏疃葘W(xué)習(xí)的人臉識別技術(shù)是由多層非線性感知器構(gòu)成的學(xué)習(xí)模型,通過大規(guī)模的樣本圖像訓(xùn)練得到識別模型,不需要進(jìn)行人工特征提取,在樣本的訓(xùn)練過程中自主的逐層學(xué)習(xí)多層信息,識別準(zhǔn)確率極高。

隨著人臉識別技術(shù)的日益成熟,人臉表情識別成為近年來人臉識別領(lǐng)域研究的熱點。表情是人類內(nèi)心世界的外在流露,也是人機(jī)交互過程中的關(guān)鍵信息。人臉表情識別可以廣泛應(yīng)用于智能駕駛、醫(yī)療護(hù)理、客戶分析等領(lǐng)域,不僅在學(xué)術(shù)研究領(lǐng)域具有重要的學(xué)術(shù)價值,在工業(yè)界也具有至關(guān)重要的應(yīng)用價值。

3.2 醫(yī)學(xué)圖像識別

醫(yī)學(xué)圖像識別的主要目標(biāo)是從海量的醫(yī)學(xué)圖像中高效、準(zhǔn)確的提取出有用的病理信息,為醫(yī)學(xué)研究、臨床診斷以及疾病治療提供堅實的基礎(chǔ)。目前,卷積神經(jīng)網(wǎng)絡(luò)已成為醫(yī)學(xué)圖像識別的首選算法,卷積神經(jīng)網(wǎng)絡(luò)以卷積算法、池化算法為基礎(chǔ),逐步提取目標(biāo)圖像中的病理信息,將提取到的圖像特征集合成高階特征,從而完成醫(yī)學(xué)圖像的識別與診斷[6]。

在學(xué)習(xí)大量的樣本圖像后,深度學(xué)習(xí)算法獲取的特征信息完全有可能超過醫(yī)生的實踐經(jīng)驗,可以站在專家的高度做出高效的判斷,既減輕了醫(yī)生的負(fù)擔(dān),又提高了診療的效率與準(zhǔn)確性,對現(xiàn)代醫(yī)學(xué)的發(fā)展具有重要的意義。

3.3 遙感圖像識別

隨著遙感圖像分辨率的日益增大,傳統(tǒng)的識別算法已無法滿足遙感圖像的識別要求,因為傳統(tǒng)算法對人工特征提取的依賴性較高。深度學(xué)習(xí)技術(shù)具有強(qiáng)大的學(xué)習(xí)能力,可以自動組合低級特征、自動的提取高級特征,還可以采用深層結(jié)構(gòu)的模型完成高分辨率遙感圖像的識別與分類,而且能夠充分利用遙感圖像的空間結(jié)構(gòu)信息。遙感圖像與深度學(xué)習(xí)技術(shù)相結(jié)合能夠有效地提取遙感圖像的有用特征,在數(shù)據(jù)降維方面的表現(xiàn)尤其突出[7]。許多學(xué)者把深度學(xué)習(xí)應(yīng)用于遙感圖像識別領(lǐng)域中,在識別建筑、道路、植被、林地、水利等地物時取得了較好的效果。

4 結(jié)語

近年來,深度學(xué)習(xí)技術(shù)的應(yīng)用范圍日益廣泛,已成為圖像識別領(lǐng)域的主流應(yīng)用技術(shù)之一。但是,深度學(xué)習(xí)模型仍具有待完善的問題,比如訓(xùn)練數(shù)據(jù)的優(yōu)化問題,這是因為深度學(xué)習(xí)對訓(xùn)練數(shù)據(jù)具有很強(qiáng)的依賴性。因此在以后的研究中要考慮如何優(yōu)化訓(xùn)練數(shù)據(jù),進(jìn)一步提高識別準(zhǔn)確率。

猜你喜歡
圖像識別人臉識別特征提取
人臉識別 等
揭開人臉識別的神秘面紗
基于Resnet-50的貓狗圖像識別
高速公路圖像識別技術(shù)應(yīng)用探討
基于Daubechies(dbN)的飛行器音頻特征提取
圖像識別在物聯(lián)網(wǎng)上的應(yīng)用
圖像識別在水質(zhì)檢測中的應(yīng)用
Bagging RCSP腦電特征提取算法
基于類獨立核稀疏表示的魯棒人臉識別
基于MED和循環(huán)域解調(diào)的多故障特征提取