国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學習的圖像處理引擎設計

2023-02-08 06:06:54楊婷婷
關(guān)鍵詞:圖像處理邊緣卷積

楊婷婷

(安徽文達信息工程學院 計算機工程學院,合肥 231201)

隨著計算機芯片、數(shù)字圖像等的發(fā)展,圖像處理技術(shù)迎來了巨大的突破,在多個領(lǐng)域都有適合的應用[1].當今時代是科技碰撞的時代,人工智能集信息科技發(fā)展成果之大成[2],深刻地改變著人們的日常生活方式和思考問題的角度.深度學習作為人工智能的核心,以培養(yǎng)機器的學習能力為目的,在不斷的應用實踐中提升著機器解決復雜問題的能力.深度圖像處理引擎設計正是從這一角度起步,探尋圖像處理實時性與質(zhì)量之間的聯(lián)系,尋求克服現(xiàn)有圖像處理引擎所存在的缺陷與弊端的方法,涉及生產(chǎn)生活中的許多方面,小到家庭電視機,大到監(jiān)控圖像傳輸,對于提高人們的生活質(zhì)量具有重大意義.

1 深度學習在圖像處理中的應用

1.1 深度學習與圖像處理

大部分傳統(tǒng)的圖像處理算法在圖像去噪上能達到好的效果,但它們的缺點也在長年累月的應用中被放大[3].一個圖像處理算法在試驗時的結(jié)構(gòu)較為固定因此很難進行性能提升和優(yōu)化,并且因為其固定性,對不同環(huán)境的自適應性較差,每到一處新環(huán)境就需要手動更改參數(shù).而且,優(yōu)良的傳統(tǒng)算法犧牲的是其功能的全面性,一個固定的模型往往是針對一個固定的任務而設計的,所以難以應付真實情況下更為復雜多變的噪聲,這些噪聲稱為真實噪聲或盲噪聲.傳統(tǒng)的濾波算法在具有此類噪點的圖像上表現(xiàn)通常不是很好.因此,濾除真實噪聲就顯得非常必要.濾除真實噪聲的核心要義是在合理的時間范圍內(nèi)盡可能保證濾除噪聲情況的真實性.為了保證這樣的真實性,最有效且合理的辦法就是讓計算機去學習噪聲分布的一般規(guī)律,就是去利用深度學習[3-4].

1.2 用于去噪的神經(jīng)網(wǎng)絡模型

為了將深度學習更好地應用在圖像處理引擎中,模型與神經(jīng)網(wǎng)絡的構(gòu)建是核心部分[5],搭建好的模型在對海量的圖片進行特征學習之后能夠掌握圖片噪聲的大體分布規(guī)律,進而得到更加貼合實際的去噪方法,這就是深度學習(Deep Learning,DL)的基本工作原理.神經(jīng)模型借助機器學習高速發(fā)展的東風,運算效能和學習能力得到爆發(fā)式的提升,在資源配置和應用能力方面更上一層樓,為建立和訓練用于去噪和圖像邊緣檢測的深度神經(jīng)網(wǎng)絡提供了技術(shù)基礎(chǔ).神經(jīng)網(wǎng)絡(ANN),是數(shù)學建模和計算機學習算法編程相結(jié)合的產(chǎn)物[6].通過特定的程序算法和數(shù)學思想進行一定層次的建模,可以給予圖像處理引擎像人腦一樣學習的能力,使其通過大規(guī)模的圖像處理訓練,利用學到的規(guī)律獲取參數(shù),不斷優(yōu)化內(nèi)部結(jié)構(gòu),最終解決現(xiàn)實中的各種復雜問題.

在圖像處理的去噪領(lǐng)域,圖像的卷積是這個領(lǐng)域的核心算法,因為卷積本身就是圖像處理過程的一種數(shù)學體現(xiàn),圖像濾波中所用到的一切比如窗口,濾波算法等,本質(zhì)上也與卷積算法中的一些運算有關(guān)聯(lián)之處,圖像的卷積算法示意圖如圖1所示.

圖1 圖像的卷積算法示意圖

1.3 圖像邊緣檢測

基于卷積神經(jīng)網(wǎng)絡的邊緣檢測的實質(zhì)是將邊緣的提取過程視為邊緣模式識別的過程,在算法實現(xiàn)上利用了神經(jīng)網(wǎng)絡所具有的自學習性、自組織性及自適應性,這些性質(zhì)使神經(jīng)網(wǎng)絡用于邊緣檢測成為可能.相比之下,傳統(tǒng)的圖像邊緣檢測算子中的閾值只能人為地去估計和設置,定的太高或者太低都會極大地損害邊緣提取結(jié)果的準確性.基于卷積神經(jīng)網(wǎng)絡的邊緣檢測不需要考慮這一點,只要給予足夠的樣本進行學習,就能獲得足量的特征用于邊緣檢測.但問題也就在這里,機器學習的質(zhì)量受樣本的質(zhì)量影響比較深,如果樣本質(zhì)量不好,那么學習的結(jié)果也不會好;另一方面,神經(jīng)網(wǎng)絡本身就是需要人為去設計的.邊緣檢測的主要步驟包括四個:濾波、增強、檢測、定位.其中圖像增強包括圖像平滑和銳化,圖像定位是邊緣檢測中最重要的一步,在深度學習中,圖像定位的實現(xiàn),本質(zhì)就是在原有圖像分類的基礎(chǔ)上加以改進.在圖像分類中,原本要輸出的結(jié)果只是經(jīng)過softmax函數(shù)得到的某類圖像的概率值,然而在目標檢測中,輸出的結(jié)果除了有softmax函數(shù)值外,還會有一個是否檢測到物體的標簽.如果檢測到了物體,就會用四個參數(shù)分別表示矩陣的左上角坐標的x,y值,及矩陣的長和寬.通過這樣的一個矩陣將目標定位出來.目前圖像定位大概分為基于灰度,基于特征,基于幾何形狀三種.

2 基于MATLAB的軟件設計

2.1 基本設計思路

要想對圖像進行便捷而高效的去噪和邊緣提取,第一步是要建立神經(jīng)網(wǎng)絡模型,然后先對該模型在指定的數(shù)據(jù)集中進行多次的迭代訓練,從而獲得合適的權(quán)重參數(shù).有了這些參數(shù)后模型才可以使用并在此基礎(chǔ)上做出正確的操作.卷積算法是模型進行圖像濾波和邊緣提取的核心.在操作完成后,圖片處理的質(zhì)量高低取決圖像處理程序算法的各項參數(shù)選取是否合適.因此,模型的事先訓練在整個實驗過程中處于最為緊要且核心的位置.軟件基本設計思路如圖2所示.

圖2 軟件基本設計思路

2.2 模型訓練

2.2.1 模型構(gòu)建

深度學習的構(gòu)建通常分為四步.(1)定義架構(gòu):構(gòu)建深度神經(jīng)模型的首要任務就是確立任務目標和網(wǎng)絡架構(gòu),根據(jù)任務需求選定合適的網(wǎng)絡體系結(jié)構(gòu).這里是要對圖像進行先濾波再檢測邊緣的操作,所以選擇卷積神經(jīng)網(wǎng)絡(CNNs).除此之外,還可以決定整個深度學習架構(gòu)的模型結(jié)構(gòu)的類型.(2)編譯模型:完成架構(gòu)定義后,繼續(xù)進行模型構(gòu)建的第二步——編譯模型.這里采用的是TensorFlow深度學習框架,使用函數(shù)進行編譯.(3)擬合模型:在模型的基礎(chǔ)框架被確立之后,下面就是擬合模型以使其可在固定數(shù)的周期(或數(shù)據(jù)集的迭代)內(nèi)訓練模型.(4)評估和預測:評估和預測是對已訓練模型進行功能判斷和效果預估的重要一步.其主要方法是確保模型的預處理步驟.剛開始時,將分割測試數(shù)據(jù)的預測也考慮在內(nèi)以證明這個模型在處理特定問題上是有效果的.

2.2.2 迭代訓練

模型迭代訓練的要點是首先對權(quán)重和偏差進行初始配置,賦予模型一組初始值,然后讓模型以這組初始值為起點不斷運行,并由運行所獲得的結(jié)果提取對應參數(shù)再返回模型中.如此循環(huán)往復,不斷更換著由初始值變換而來的參數(shù)和優(yōu)化著自身架構(gòu),直到獲取能產(chǎn)生最多理想結(jié)果的權(quán)重參數(shù)和損失系數(shù)為止.神經(jīng)網(wǎng)絡模型的迭代訓練就是這么一個收斂的過程,因此,模型初始參數(shù)的設置顯得尤為重要,如果設置不當,極有可能導致模型訓練時間指數(shù)級延長或模型發(fā)散,模型迭代訓練的基本原理如圖3所示.

圖3 模型迭代訓練的基本原理

2.3 系統(tǒng)性能評價標準

本文的圖像增強引擎包含去噪、圖像邊緣提取兩種功能,評價增強后的圖像需要用衡量指標來評定.圖像質(zhì)量的評價從方法上分為主觀評價和客觀評價.本次實驗使用的是客觀評價方法的三個重要指標,它們是峰值信噪比(PSNR,Peak Signal to Noise Rate)、均方誤差(MSE,Mean Squared Error)以及結(jié)構(gòu)相似性(SSIM,Structural Similarity).其中峰值信噪比如式(1)所示:

(1)

其中:MAX的平方為原始圖像的最大像素值,一般針對uint8圖像,最大像素值為255.均方誤差假設原始圖像I大小為M × N的以及經(jīng)過處理的圖像K,則均方誤差如式(2)所示:

(2)

均方誤差所衡量的是原始圖像和處理后圖像像素差的均方值,再通過均方值的大小確定兩個圖像的差異.MSE越大,兩者差異越大;MSE越小,兩者差異越小.最后一種標準是結(jié)構(gòu)相似性,是基于兩個圖像三個指標來進行比較的,指標包括亮度、對比度和結(jié)構(gòu).這些指標和SSIM如式(3)—式(6)所示:

(3)

(4)

(5)

SSIM(x,y)=[l(x,y)αc(x,y)βs(x,y)γ]

(6)

計算時要用到x,y的均值、方差和協(xié)方差,并且每次計算時都會從圖片上取一個N×N的窗口,然后不斷滑動窗口計算,最后取均值作為全圖的SSIM.

3 系統(tǒng)測試

3.1 圖片的輸入及預處理

在深度學習中,進行模型的迭代訓練之前,為了獲得更多數(shù)據(jù)對,需要先對既定的圖像數(shù)據(jù)進行預處理操作.具體操作包括圖像二值化,壓縮,旋轉(zhuǎn);取反,加入高斯噪聲.目的是為了獲取更多訓練值.

3.2 圖像處理結(jié)果及分析

為了驗證模型的訓練成效及其在圖像去噪和邊緣檢測方面的適用性,隨機在數(shù)據(jù)集中選取了兩張不同的圖片,分別對其進行圖像濾波和邊緣提取,運行結(jié)果分別如圖4和圖5所示:

圖4 去噪模型運行結(jié)果

圖5 邊緣檢測模型運行結(jié)果

由圖4可以看出,該神經(jīng)網(wǎng)絡在圖像去噪方面效果很好.噪點有明顯的減少,并且可以看到圖像正嘗試針對損壞的像素以適應圖像原始顏色.最終的PSNR得分為30.605 8,SSIM得分為0.819 2.

通過傳統(tǒng)邊緣檢測算子與本文的基于深度學習邊緣檢測相結(jié)合的方法,在加入一定噪聲情況下的卷積神經(jīng)網(wǎng)絡,通過實驗驗證,邊緣檢測效果明顯比傳統(tǒng)經(jīng)典算子更優(yōu)秀,不僅可以濾除圖像中的干擾噪聲,并且檢測出的圖像細節(jié)基本得以保留完整.在實際應用中可以針對不同的環(huán)境條件和檢測要求對圖像進行邊緣檢測,以求達到最好的檢測效果.

4 結(jié)語

圖像處理技術(shù)在日常生活中的重要性已不言而喻.基于深度學習的圖像去噪方法更關(guān)注真實圖像的去噪,對實際應用環(huán)境的適應性更強.如何在獲取更加高效和便捷濾波去噪方法的同時盡可能保留圖像的原始特征,是去噪模型需要不斷自我完善以達到的目標.

邊緣檢測則是在提高檢測效率的同時追求的魯棒性的提高.當真正想檢測出復雜圖像的邊緣時,不一定要去采用絕對固定的算子模板,無論是程序編寫還是模型訓練,思想一定都不能固化,將固定值轉(zhuǎn)化為可變的參數(shù)以去適應不同環(huán)境不失為一種很好的解決問題切入角度,在不同的環(huán)境中提取共性能夠幫助提高圖像處理實時性.正是卷積計算使深度模型具備了提取特征的能力.將這矩陣中數(shù)字當成參數(shù)的思想,已經(jīng)成為計算機視覺中最有效的思想之一.

猜你喜歡
圖像處理邊緣卷積
基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
機器學習在圖像處理中的應用
電子制作(2018年18期)2018-11-14 01:48:20
基于傅里葉域卷積表示的目標跟蹤算法
模糊圖像處理,刑事偵查利器
圖像處理技術(shù)的實戰(zhàn)應用
一張圖看懂邊緣計算
一種基于卷積神經(jīng)網(wǎng)絡的性別識別方法
Photo Shop通道在圖像處理中的應用
河南科技(2014年1期)2014-02-27 14:04:06
在邊緣尋找自我
雕塑(1999年2期)1999-06-28 05:01:42
中江县| 仙居县| 双辽市| 罗城| 长治市| 建水县| 淮南市| 巴中市| 沁水县| 屯昌县| 汤阴县| 水富县| 治多县| 玉环县| 虞城县| 宁阳县| 茌平县| 大埔县| 孟津县| 肇东市| 肃宁县| 永泰县| 临漳县| 乡城县| 凤阳县| 温泉县| 武平县| 东乡族自治县| 丹棱县| 清苑县| 池州市| 边坝县| 天祝| 朝阳县| 洞口县| 新乐市| 淮滨县| 无棣县| 长海县| 永年县| 镇雄县|