国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

深度學(xué)習(xí)下的卷積神經(jīng)網(wǎng)絡(luò)圖像清晰度識(shí)別分析

2023-01-05 17:13:05孫明輝
電子元器件與信息技術(shù) 2022年2期
關(guān)鍵詞:池化清晰度卷積

孫明輝

(貝葉斯電子科技有限公司,浙江 紹興 312000)

0 引言

由于時(shí)代的持續(xù)性發(fā)展,圖像作為一種信息傳播介質(zhì)逐漸發(fā)揮著愈發(fā)重要的信息交流作用。但是圖像在采集、傳輸?shù)绕陂g,極易出現(xiàn)一些失真問(wèn)題,造成圖像信息無(wú)法精準(zhǔn)地表達(dá)。在圖像清晰度識(shí)別方面,傳統(tǒng)的應(yīng)用技術(shù)一般是利用提取圖像特征等方法給予識(shí)別與評(píng)估。由于圖像特征的提取具備較強(qiáng)的復(fù)雜性,特別是對(duì)高維圖像、背景復(fù)雜圖像等來(lái)說(shuō),在提取其數(shù)據(jù)特征等方面存在一定的偏差。一些學(xué)者通過(guò)對(duì)失真圖像展開研究,發(fā)現(xiàn)需要對(duì)其中提取的圖像特征進(jìn)行區(qū)別整合。例如:一些學(xué)者通過(guò)提取圖像中的均方誤差、峰值信噪比、圖像亮度、對(duì)比性等參數(shù),將其認(rèn)定是支持向量機(jī)的輸入?yún)?shù),接下來(lái)對(duì)其實(shí)施模型建設(shè)與評(píng)估。還有一些學(xué)者利用離散余弦調(diào)整區(qū)域內(nèi)的頻率系數(shù)進(jìn)行特征統(tǒng)計(jì)、峰度值、顏色飽和度等分析,然后將其當(dāng)作是支持向量機(jī)輸入?yún)?shù),由此能夠確定圖像的模糊比。還有一些學(xué)者認(rèn)為,需要通過(guò)分析空間對(duì)比與結(jié)構(gòu)分布等IQA方法進(jìn)行圖像識(shí)別度分析,然后確定圖像的灰度波動(dòng)圖,并創(chuàng)建與原圖空間結(jié)構(gòu)信息變化相吻合的矩陣,接下來(lái)通過(guò)支持向量回歸法實(shí)施模型訓(xùn)練,由此能夠?qū)崿F(xiàn)識(shí)別目的。部分學(xué)者認(rèn)為,按照諧波均值的匯總方法評(píng)估FR-IQA的最終質(zhì)量分值,由此來(lái)區(qū)分圖像的清晰度。盡管通過(guò)提取圖像特征能夠獲得比較清晰的圖像識(shí)別信息,但是必須要通過(guò)一系列復(fù)雜的預(yù)處理過(guò)程,方可獲得較高圖像的清晰度,同時(shí)圖像的特征提取也是非常繁瑣的。因?yàn)樘卣魈崛〉碾y度非常大,對(duì)此,這種方法的通用性并不強(qiáng)。

結(jié)合以上方法的分析與研究來(lái)看,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)給予識(shí)別分析,將整合到的圖像混合到各個(gè)程度的高斯造影中,創(chuàng)建Caffe框架結(jié)合GoogLeNet網(wǎng)絡(luò)模型,然后把存在造影與清晰的原圖直接當(dāng)作輸入?yún)?shù),接下來(lái)利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)其實(shí)施模型創(chuàng)建,即可獲得相應(yīng)的分析結(jié)果。整個(gè)處理構(gòu)成非常精簡(jiǎn)、直接、高效,通過(guò)大量的實(shí)驗(yàn)?zāi)軌蝌?yàn)證了這一技術(shù)的精準(zhǔn)性、有效性等,而且能夠直接取消繁瑣圖像特征的預(yù)處理過(guò)程。對(duì)此,在圖像信息處理方面存在較強(qiáng)的實(shí)踐應(yīng)用價(jià)值。接下來(lái)通過(guò)實(shí)驗(yàn)分析法對(duì)這一技術(shù)的實(shí)際應(yīng)用流程展開整理與分析。

1 實(shí)驗(yàn)數(shù)據(jù)處理

實(shí)驗(yàn)數(shù)據(jù)來(lái)自于某高速公路若干個(gè)卡口的高清圖像,攝像頭整合到的圖像一般覆蓋了不同的時(shí)間段,對(duì)此,數(shù)據(jù)覆蓋的信息量是非常大的,而且還存在一些復(fù)雜的干擾因素(例如:在不同的氣候或者環(huán)境下等),最初的數(shù)據(jù)僅僅是增添了程度不一的三類高斯噪聲,其方差各是0.01、0.07與0.3,由此能夠說(shuō)明實(shí)驗(yàn)研究方法的精準(zhǔn)性、穩(wěn)定性。實(shí)驗(yàn)操作過(guò)程中對(duì)應(yīng)的圖像總計(jì)是177340張(原圖和三類噪聲圖像各是44335張),在實(shí)施訓(xùn)練操作的過(guò)程中,訓(xùn)練集與評(píng)測(cè)集各是90%與10%。

2 識(shí)別原理

2.1 caffe框架

caffe框架是由伯克利人工智能研究小組和伯克利視覺和學(xué)習(xí)中心開發(fā)的,這是一個(gè)具有可讀性同時(shí)內(nèi)容清晰、完整的深度學(xué)習(xí)開源框架,其通常對(duì)應(yīng)的是C++語(yǔ)言編寫,能夠兼容命令行、Python與Matlab接口,其對(duì)應(yīng)的內(nèi)部構(gòu)件有五個(gè),即:Solver、Net、Laver、Blob、Proto等。①對(duì)于Solver模塊來(lái)說(shuō),其包括兩大構(gòu)成元素,即:訓(xùn)練網(wǎng)絡(luò)與評(píng)測(cè)網(wǎng)絡(luò),其功能是對(duì)深度網(wǎng)絡(luò)模型實(shí)施訓(xùn)練指導(dǎo),這也屬于實(shí)驗(yàn)數(shù)據(jù)處理的一個(gè)重要構(gòu)成元素。值得注意的是,這一組件一般是用于對(duì)深度網(wǎng)絡(luò)模型的創(chuàng)建與訓(xùn)練,必然會(huì)對(duì)最終的實(shí)驗(yàn)效果帶來(lái)一定的影響,這種情況通常能夠引起大部分實(shí)驗(yàn)者的關(guān)注。②對(duì)于Net模塊來(lái)說(shuō),其一般是對(duì)模型內(nèi)的函數(shù)實(shí)施計(jì)算,然后通過(guò)不同系列層組合而成,對(duì)應(yīng)的是五環(huán)計(jì)算圖,若要確保前向迭代與逆向迭代的精準(zhǔn)性,需要保留計(jì)算圖內(nèi)全部的中間值。比如:一個(gè)最具有代表性的Net模型一般是由磁盤中加載數(shù)據(jù)進(jìn)行推進(jìn)的,由完成計(jì)算分類和重構(gòu)目標(biāo)函數(shù)的任務(wù)這一過(guò)程開始,能夠在這一模塊中發(fā)揮整體運(yùn)輸?shù)裙δ?。③Layer模型屬于創(chuàng)建框架體系的一個(gè)重要的網(wǎng)絡(luò)基礎(chǔ),并且也屬于模型組成單元中一個(gè)規(guī)模非常小的計(jì)算單元,其功能有兩個(gè):計(jì)算模型內(nèi)的本質(zhì)特征,明確具體的落實(shí)任務(wù)。在進(jìn)行信號(hào)輸入或輸出的過(guò)程中,一般是通過(guò)“Input Blob或Output BLOB”等給予闡釋。④對(duì)于Blob模塊來(lái)說(shuō),其屬于框架的一個(gè)存續(xù)結(jié)構(gòu),一般是用來(lái)負(fù)責(zé)對(duì)數(shù)據(jù)處理形成的具體數(shù)據(jù)實(shí)施封存,也能夠存儲(chǔ)一個(gè)無(wú)限維數(shù)的矩陣,一般來(lái)說(shuō),則能夠?qū)ζ渲械母呔S數(shù)據(jù)實(shí)施便捷化處理。⑤對(duì)于Proto模塊來(lái)說(shuō),其一般是按照框架內(nèi)對(duì)其中的一些結(jié)構(gòu)進(jìn)行讀取、存取等功能,由此能夠?qū)崿F(xiàn)數(shù)據(jù)的轉(zhuǎn)換,并進(jìn)一步明確用戶定義數(shù)據(jù)格式的具體參考標(biāo)準(zhǔn),能夠在不同語(yǔ)言系統(tǒng)中對(duì)不同的對(duì)象進(jìn)行序列化處理。

2.2 卷積神經(jīng)網(wǎng)絡(luò)

一開始的卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用是為了辨別二維圖像形狀,其對(duì)應(yīng)的是不同的感知器,能夠發(fā)揮自主學(xué)習(xí)等特點(diǎn),而且還能夠自行處理相關(guān)數(shù)據(jù),具備非常強(qiáng)的容錯(cuò)性,其權(quán)值共享和局部連接的網(wǎng)絡(luò)結(jié)構(gòu)與生物神經(jīng)網(wǎng)絡(luò)存在一定的類同性,能夠大大減少網(wǎng)絡(luò)模型的繁瑣度,并且也能夠降低權(quán)值數(shù)量?;诖?,它通常是在上世紀(jì)末期得到深入性地運(yùn)用,因?yàn)樵谀莻€(gè)年代中,計(jì)算機(jī)技術(shù)的發(fā)展速度相對(duì)滯緩,并未與時(shí)代發(fā)展同步(缺乏訓(xùn)練數(shù)據(jù),并且計(jì)算過(guò)程繁瑣等),但是若要通過(guò)深層次的神經(jīng)網(wǎng)絡(luò)進(jìn)行相關(guān)模型提煉,則存在一定的難度。不過(guò),若有通過(guò)深層次的神經(jīng)網(wǎng)絡(luò)系統(tǒng)中獲得相關(guān)模型,也是比較困難的一件事情,對(duì)此,對(duì)其展開深入性地研究困難重重。這些年來(lái),因?yàn)橛?jì)算機(jī)對(duì)應(yīng)的一些技術(shù)得到廣泛發(fā)展,且應(yīng)用范圍在不斷擴(kuò)大,所以隨著硬件諸如CPU技術(shù)的持續(xù)升級(jí),之前存在的一些無(wú)法解決的問(wèn)題,能夠在目前技術(shù)應(yīng)用下得到有效地解決與處理,讓卷積神經(jīng)網(wǎng)絡(luò)在一些熱門的機(jī)器設(shè)備中發(fā)揮積極的推動(dòng)作用,并且能夠大范圍地滲透到圖像處理范圍內(nèi),其常見的有兩種,即:卷積層與池化層。①卷積層是CNN和核心操作,主要作用是特征提取[1],一般是包括若干個(gè)特征面,并且不同的特征面一般對(duì)應(yīng)著若干個(gè)最小單元的神經(jīng)元,其數(shù)量不一。神經(jīng)元是一種相對(duì)獨(dú)特的輸出函數(shù),其一般是利用卷積核和上一層特征面的局部區(qū)域?qū)樱纱四軌驅(qū)矸e操作獲得的輸出圖形特征進(jìn)行提取,從而更完整地捕捉到相關(guān)圖像的識(shí)別信息。另外,卷積層輸入通常代表著一個(gè)三維數(shù)據(jù)。另外,對(duì)于卷積層的參數(shù)來(lái)說(shuō),又稱作為矩陣或卷積核,通常是按照隨機(jī)梯度下降更新的方式對(duì)其中的參數(shù)進(jìn)行調(diào)整。②池化包括最大池化和平均池化[2],一般是指對(duì)卷積層輸出特征實(shí)施操控與處理,由于輸入的是一些存在完整性的圖像,涉及到一些不重要的次特征,對(duì)此,通過(guò)池化處理能夠確定主特征,由此能夠增強(qiáng)特征局部的不穩(wěn)定性,并且能夠大大提升計(jì)算速度,其一般是對(duì)不同區(qū)域中用來(lái)運(yùn)算這一區(qū)域中特征的中間值或最大值進(jìn)行整合[3],然后實(shí)施個(gè)性化的訓(xùn)練與指導(dǎo),由此能夠創(chuàng)建一個(gè)訓(xùn)練模型。由此來(lái)看,池化層代表著對(duì)不同特征圖進(jìn)行單獨(dú)操作與設(shè)計(jì),同時(shí)還需要輸入一個(gè)相應(yīng)的特征圖。如果認(rèn)定池化范圍已經(jīng)確定的話,那么其對(duì)應(yīng)的輸入特征圖,需要提取其中一些小圖,并確定子圖的最大值,或者用來(lái)確定子圖的中間值,由此能夠?qū)⑵湔J(rèn)定是一個(gè)輸出值。在進(jìn)行簽證的過(guò)程中,通常能夠?qū)⑵湔J(rèn)定是最大化池化,后者代表著均值池化。在創(chuàng)建池化層的過(guò)程中,其功能一般是用來(lái)減少特征圖的分辨率,同時(shí)能夠縮減其計(jì)算規(guī)模,由此能夠大大提升網(wǎng)絡(luò)的魯棒性能[4-6]。

3 實(shí)驗(yàn)結(jié)果與分析

如果把混入高斯噪聲之后的圖像數(shù)據(jù)集一并地上傳至實(shí)驗(yàn)系統(tǒng)中,即可創(chuàng)建最終的訓(xùn)練模型,然后把數(shù)據(jù)集中的10%(各類對(duì)應(yīng)4433張圖片)認(rèn)定是驗(yàn)證集,然后對(duì)其驗(yàn)證處理,最后即可獲得實(shí)驗(yàn)結(jié)果。

由此來(lái)看,如果是在GoogLeNet網(wǎng)絡(luò)模型的作用下創(chuàng)建的預(yù)測(cè)模型,那么其對(duì)應(yīng)的輸出結(jié)果通常能夠滲透到混淆矩陣中,它一般是用來(lái)呈現(xiàn)模型分類的一個(gè)正確數(shù)與錯(cuò)誤數(shù),通過(guò)矩陣分析能夠發(fā)現(xiàn):對(duì)含有混合高斯噪聲方差是0.01的圖片,在對(duì)其進(jìn)行識(shí)別分析的過(guò)程中,僅有一張識(shí)別錯(cuò)誤,精準(zhǔn)性突破99.98%,對(duì)于原圖像的識(shí)別率來(lái)說(shuō),精準(zhǔn)率是99.62%,其對(duì)應(yīng)了17張圖片識(shí)別錯(cuò)誤;對(duì)應(yīng)噪聲方差是0.07的識(shí)別率,通常也僅有99.59%;對(duì)應(yīng)的噪聲方差是0.3,其識(shí)別率盡管是非常小的,但是一般能夠突破96.38%,盡管整體的識(shí)別率非常小,大概是6.38%,但是其中某一張的識(shí)別率是極高的。通過(guò)這一數(shù)據(jù)能夠發(fā)現(xiàn):對(duì)于這種圖像信息提取方法來(lái)說(shuō),其對(duì)于圖像清晰度的識(shí)別效果是非常明顯的,由此能夠直接說(shuō)明這種評(píng)估方面具備較強(qiáng)的可行性與有效性。

4 結(jié)語(yǔ)

隨著科學(xué)技術(shù)的持續(xù)性發(fā)展,網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)飛躍升級(jí),圖像與社會(huì)中各個(gè)行業(yè)的信息傳遞有著很大的相關(guān)性。在海量數(shù)據(jù)整合、分析等背景下,對(duì)其實(shí)施圖像識(shí)別則是目前大數(shù)據(jù)下的研究熱點(diǎn),并且也對(duì)圖像特征信號(hào)提出極大的要求。現(xiàn)今,考慮到圖像信息存在一定的繁瑣性,而且對(duì)應(yīng)的一些運(yùn)算技術(shù)存在一定的局限性。所以,在圖像識(shí)別層面來(lái)看,識(shí)別精度與性能提升已經(jīng)是目前研究工作的一個(gè)重難點(diǎn)。其對(duì)應(yīng)的主流技術(shù)比較多。不同學(xué)者通過(guò)長(zhǎng)期的研究發(fā)現(xiàn):在運(yùn)用深度學(xué)習(xí)技術(shù)之后,其在圖像清晰度識(shí)別方面的應(yīng)用是愈加廣泛與深入。通過(guò)自然語(yǔ)言處理、語(yǔ)言個(gè)性化識(shí)別等,能夠獲得不錯(cuò)的研究成效。對(duì)此在本文的研究中,筆者以深度研究發(fā)現(xiàn)探討卷積神經(jīng)網(wǎng)絡(luò)圖像清晰度識(shí)別的具體應(yīng)用策略。根據(jù)圖像清晰度的識(shí)別分析,我們能夠發(fā)現(xiàn):在通過(guò)不同提取方法展開研究的過(guò)程中,其能夠直接識(shí)別出程度不一的噪聲圖像。那么與一些傳統(tǒng)的操作技術(shù)進(jìn)行對(duì)比,一般需要把原始圖像對(duì)其展開預(yù)處理,例如:提取圖像的部分特征等進(jìn)行操作處理,把提取到的一些特征認(rèn)定是支持向量機(jī)的輸入?yún)?shù),在對(duì)其進(jìn)行訓(xùn)練模型分類的過(guò)程中,還需要?jiǎng)?chuàng)建相應(yīng)的模型,同時(shí)還需要?jiǎng)?chuàng)建一個(gè)固定閾值,由此能夠確定圖像的清晰度。這種提取方法具備的優(yōu)勢(shì)是非常突出的,那就是無(wú)需對(duì)圖像實(shí)施預(yù)處理,即可獲得相關(guān)信息的提取特征。另外,也能夠直接把圖像認(rèn)定是輸入?yún)?shù),借助于卷積神經(jīng)網(wǎng)絡(luò)對(duì)其實(shí)施深度分析,由此能夠創(chuàng)建訓(xùn)練模型,接下來(lái)還需要將驗(yàn)證集的圖像輸入至模型內(nèi),對(duì)其進(jìn)行驗(yàn)證分析,最后能夠確定最終的實(shí)驗(yàn)信息。根據(jù)此次的實(shí)驗(yàn)驗(yàn)證結(jié)果能夠發(fā)現(xiàn):這一方法在識(shí)別圖像清晰度方面是非常高的,其精準(zhǔn)率能夠突破99.98%,也就是說(shuō),針對(duì)這一類圖像的清晰度來(lái)說(shuō),其存在一定的類同性,通常能夠給予直接識(shí)別與分析。這種方法的應(yīng)用能夠避免圖像在傳遞、采集等過(guò)程中受到噪聲等因素的干擾,而且也能夠確保圖像信息能夠更加完整、清晰地呈現(xiàn)出相應(yīng)的圖像內(nèi)容,以便于進(jìn)行前端設(shè)備監(jiān)測(cè),確保工作人員能夠動(dòng)態(tài)地掌握設(shè)備的運(yùn)行狀態(tài)。

總而言之,卷積神經(jīng)網(wǎng)絡(luò)是一種用來(lái)模仿人體神經(jīng)組織的模型結(jié)構(gòu),它的內(nèi)部組成包括兩大部分:卷積層與池化層。同時(shí),在具體應(yīng)用的過(guò)程中,必須要明確上下級(jí)的層級(jí)規(guī)則,而且還需要確定周圍神經(jīng)組織之間的銜接性,由此能夠確保不同層級(jí)之間的強(qiáng)約束力,并使其維持一定的關(guān)聯(lián)性。通過(guò)深度學(xué)習(xí)理念在圖像分類、清晰度等識(shí)別中的靈活應(yīng)用,能夠體現(xiàn)出目前大數(shù)據(jù)的應(yīng)用價(jià)值,而且也是目前機(jī)器領(lǐng)域智能化研究的一個(gè)重要熱點(diǎn),為了能給更加清晰、完整、高效地實(shí)現(xiàn)圖形分類、圖像信息識(shí)別等帶來(lái)可能。在本文的研究中,必須通過(guò)模型訓(xùn)練,然后借助于深度分析法分析建構(gòu)模型的網(wǎng)絡(luò)參數(shù)與特征信號(hào),最后發(fā)現(xiàn),在算法性能、識(shí)別精準(zhǔn)性等方面得到明顯提升,由此來(lái)看,這一應(yīng)用方法具備一定的推廣與實(shí)踐價(jià)值。當(dāng)然,在本文的研究中,也存在一些遺憾的地方,那就是在訓(xùn)練環(huán)節(jié)耗用的資源比較多,希望在今后的研究中能夠繼續(xù)優(yōu)化和完善。

猜你喜歡
池化清晰度卷積
基于緊湊型雙線性網(wǎng)絡(luò)的野生茵識(shí)別方法研究
基于Sobel算子的池化算法設(shè)計(jì)
卷積神經(jīng)網(wǎng)絡(luò)中的自適應(yīng)加權(quán)池化
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
鮮明細(xì)膩,擁有更好的清晰度 Ascendo Immersive Audio CCRM-12 MKII/CCRM-6P/SMS-15
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于卷積神經(jīng)網(wǎng)絡(luò)和池化算法的表情識(shí)別研究
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
聽音訓(xùn)練對(duì)漢語(yǔ)單音節(jié)聽感清晰度的影響
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法
富阳市| 库尔勒市| 通河县| 邵东县| 汉沽区| 五峰| 蓝山县| 阿勒泰市| 沅江市| 湄潭县| 瓮安县| 怀宁县| 兴安县| 大英县| 文化| 海林市| 龙游县| 伊春市| 锦州市| 明星| 同仁县| 同心县| 崇信县| 边坝县| 上杭县| 拉孜县| 瑞金市| 游戏| 永新县| 谢通门县| 涡阳县| 加查县| 东港市| 射洪县| 定边县| 达尔| 灌云县| 河东区| 潞城市| 循化| 宁德市|