陳宏君 謝建民
(湖南交通工程學(xué)院,湖南 衡陽 421009)
在過去,傳統(tǒng)的二維環(huán)境中物體只能顯示側(cè)面投影,隨著科技的發(fā)展,人們創(chuàng)造出三維立體畫面,并將其作為新型顯示技術(shù)。文章通過設(shè)計一種真三維顯示計算機(jī)視覺系統(tǒng),提出計算機(jī)視覺算法對物體投影過程中畸變圖像的矯正。這種圖像處理技術(shù)與過去的BP 神經(jīng)網(wǎng)絡(luò)相比,其矯正精度更高,可以被廣泛應(yīng)用于圖像處理。
利用計算機(jī)處理圖像需要對圖像進(jìn)行解析與加工,從中得到所需要的目標(biāo)圖像。圖像處理技術(shù)應(yīng)用時主要包含以下兩個過程:(1)轉(zhuǎn)化要處理的圖像,將圖像變成計算機(jī)系統(tǒng)支持識別的數(shù)據(jù),再將數(shù)據(jù)存儲到計算機(jī)中,方便進(jìn)行接下來的圖像處理。(2)將存儲在計算機(jī)中的圖像數(shù)據(jù)采用不同方式與計算方法,進(jìn)行圖像格式轉(zhuǎn)化與數(shù)據(jù)處理。
計算機(jī)圖像處理中,圖像的類別主要有以下幾種:(1)模擬圖像。這種圖像在生活中很常見,有光學(xué)圖像和攝影圖像,攝影圖像就是膠片照相機(jī)中的相片。計算機(jī)圖像中模擬圖像傳輸時十分快捷,但是精密度較低,應(yīng)用起來不夠靈活。(2)數(shù)字化圖像。數(shù)字化圖像是信息技術(shù)與數(shù)字化技術(shù)發(fā)展的產(chǎn)物,隨著互聯(lián)網(wǎng)信息技術(shù)的發(fā)展,圖像已經(jīng)走向數(shù)字化。與模擬圖像相比,數(shù)字化圖像精密度更高,且處理起來十分靈活,是人們當(dāng)前常見的圖像種類。
分析圖像處理技術(shù)的特點(diǎn),具體如下:(1)圖像處理技術(shù)的精密度更高。隨著社會經(jīng)濟(jì)的發(fā)展與技術(shù)的推動,網(wǎng)絡(luò)技術(shù)與信息技術(shù)被廣泛應(yīng)用于各個行業(yè),特別是圖像處理方面,人們可以將圖像數(shù)字化,最終得到二維數(shù)組。該二維數(shù)組在一定設(shè)備支持下可以對圖像進(jìn)行數(shù)字化處理,使二維數(shù)組發(fā)生任意大小的變化。人們使用掃描設(shè)備能夠?qū)⑾袼鼗叶鹊燃壛炕?,灰度能夠得?6 位以上,從而提高技術(shù)精密度,滿足人們對圖像處理的需求。
(2)計算機(jī)圖像處理技術(shù)具有良好的再現(xiàn)性。人們對圖像的要求很簡單,只是希望圖像可以還原真實(shí)場景,讓照片與現(xiàn)實(shí)更加貼近。過去的模擬圖像處理方式會使圖像質(zhì)量降低,再現(xiàn)性不理想。應(yīng)用圖像處理技術(shù)后,數(shù)字化圖像能夠更加精準(zhǔn)的反映原圖,甚至處理后的數(shù)字化圖像可以保持原來的品質(zhì)。此外,計算機(jī)圖像處理技術(shù)能夠科學(xué)保存圖像、復(fù)制圖像、傳輸圖像,且不影響原有圖像質(zhì)量,有著較高的再現(xiàn)性。
(3)計算機(jī)圖像處理技術(shù)應(yīng)用范圍廣。不同格式的圖像有著不同的處理方式,與傳統(tǒng)模擬圖像處理相比,該技術(shù)可以對不同信息源圖像進(jìn)行處理,不管是光圖像、波普圖像,還是顯微鏡圖像與遙感圖像,甚至是航空圖片也能夠在數(shù)字編碼設(shè)備的應(yīng)用下成為二維數(shù)組圖像。因此,計算機(jī)圖像處理技術(shù)應(yīng)用范圍叫廣,無論是哪一種信息源都可以將其數(shù)字化處理,并存入計算機(jī)系統(tǒng)中,在計算機(jī)信息技術(shù)的應(yīng)用下處理圖像數(shù)據(jù),從而滿足人們對現(xiàn)代生活的需求。
真三維立體顯示與二維像素相對應(yīng)比較,真三維可以將三維數(shù)據(jù)場內(nèi)每一個點(diǎn)都在立體空間內(nèi)成像。成像點(diǎn)就是三維成像的體素點(diǎn),一系列體素點(diǎn)構(gòu)成了真三維立體圖像,應(yīng)用光學(xué)引擎與機(jī)械運(yùn)動的方式可以將光場重構(gòu)。闡述該技術(shù)的原理,可以使用五維光場函數(shù)去分析三維立體空間內(nèi)的光場函數(shù),即,F(xiàn):L∈R5→I∈R3,L=[x,y,z,],這是五維光場函數(shù)中空間點(diǎn)的三維坐標(biāo)和坐標(biāo)下方向,而代表的是該數(shù)字化圖像顏色信息。當(dāng)三維圖像模型與紋理能夠由離散點(diǎn)集表示,離散點(diǎn)集如下:。代表的是空間點(diǎn)內(nèi)的位置與顏色。圖(1)為該計算機(jī)視覺算法下,光場的傳播情況。
圖1:光場傳播圖
接下來,可以對點(diǎn)集L 中的h 深度子集進(jìn)行光場三維重構(gòu)。將點(diǎn)集按照深度進(jìn)行劃分,最終可以劃分成多個子集,任意一個子集都可以利用散射屏幕與二維投影形成光場重構(gòu),且這種重構(gòu)后的圖像是三維狀態(tài)的。經(jīng)過研究表明,應(yīng)用二維投影技術(shù)可以對切片圖像實(shí)現(xiàn)重構(gòu),且該技術(shù)實(shí)現(xiàn)的高速旋轉(zhuǎn)狀態(tài),重構(gòu)的圖像也屬于三維光場范圍。
本文以計算機(jī)視覺算法為基礎(chǔ),闡述圖像處理技術(shù)。技術(shù)實(shí)現(xiàn)過程中需要應(yīng)用ARM 處理裝置,在該裝置的智能交互作用下實(shí)現(xiàn)真三維顯示系統(tǒng),人們可以從各個角度觀看成像。真三維顯示系統(tǒng)中,成像的分辨率很高,體素能夠達(dá)到30M。與過去的旋轉(zhuǎn)式LED 點(diǎn)陣體三維相比,這種柱形狀態(tài)的成像方式雖然可以重構(gòu)三維光場,但是該成像視場角不大,分辨率也不高。
圖(2)為真三維立體顯示框圖的基本信息,人們在三維環(huán)境中拍攝物體,需要以三維為基礎(chǔ)展示物體,然后將投影后的物體成像序列存儲在SDRAM 內(nèi)。應(yīng)用FPGA 視頻采集技術(shù),在技術(shù)的支持下將圖像序列傳導(dǎo)入ARM 處理裝置內(nèi),完成對圖像的切片處理,圖像數(shù)據(jù)信息進(jìn)入DVI 視頻接口,并在DMD 控制設(shè)備的處理后,圖像信息進(jìn)入高速投影機(jī)。經(jīng)過一系列操作,最終DLP 可以將數(shù)字化圖像朝著散射屏的背面實(shí)現(xiàn)投影。想要實(shí)現(xiàn)圖像信息的高速旋轉(zhuǎn),需要應(yīng)用伺服電機(jī),在電機(jī)的驅(qū)動下,轉(zhuǎn)速傳感器可以探測到轉(zhuǎn)臺的角度和速度,并將探測到的信號傳遞到控制器中,形成對轉(zhuǎn)臺的閉環(huán)式控制。
當(dāng)伺服電機(jī)運(yùn)動在高速旋轉(zhuǎn)環(huán)境中,設(shè)備也會將采集裝置位置信息同步,DVI 信號輸出幀頻,控制器產(chǎn)生編碼,這個編碼就是DVI 幀頻信號。這樣做可以確保散射屏與數(shù)字化圖像投影之間擁有同步性,圖(3)為本次基于計算機(jī)視覺算法設(shè)計出的智能交互真三維顯示裝置。根據(jù)圖中的信息得知,該智能交互真三維顯示裝置由轉(zhuǎn)臺和散射屏構(gòu)成,其中還有伺服電機(jī)、采集設(shè)備、高速旋轉(zhuǎn)投影機(jī)、控制器與ARM 處理裝置,此外還包括體態(tài)攝像頭組與電容屏等其他部分。
圖2:真三維立體顯示
圖3:智能交互真三維顯示裝置
圖片中,序號1 為玻璃罩,上方有體態(tài)攝像頭裝置;序號2 是半透半反屏;序號3 是上轉(zhuǎn)臺;序號4 是高速投影機(jī);序號5 是電動機(jī);序號6 是傳感器裝置和傳到結(jié)構(gòu);序號7 與8為電源與轉(zhuǎn)臺;序號9 是連接軸承;序號10、11 為底座和吸光板;序號12 為傳感器;13 為另一個電動機(jī);14 為ARM 處理裝置;15 和16 為SD 卡卡槽和視頻采集系統(tǒng)。該裝置擁有較強(qiáng)的人機(jī)交互功能,圖像成像之后有著較高的分辨力,幀頻最高可以達(dá)到104 級fps。
在計算機(jī)視覺算法應(yīng)用下,人們可以應(yīng)用計算機(jī)處理畸變圖像。當(dāng)投影設(shè)備對圖像垂直投影時,隨著視場的變化,其成像垂軸的放大率也會發(fā)生變化,這種變化會讓智能交互真三維顯示裝置中的半透半反屏像素點(diǎn)發(fā)生偏移,如果偏移程度過大,圖像就會發(fā)生畸變。因此,人們需要采用計算機(jī)圖像處理技術(shù)將畸變后的圖像進(jìn)行校正。由于圖像發(fā)生了幾何變形,就要基于圖像畸變校正算法對圖片進(jìn)行幾何校正,從發(fā)生畸變圖像中盡可能消除畸變,且將圖像還原到原有狀態(tài)。這種處理技術(shù)就是將畸變后的圖像在幾何校正中消除幾何畸變。投影設(shè)備中主要有徑向畸變和切向畸變兩種,但是切向畸變在圖像畸變方面影響程度不高,因此人們在研究圖像畸變算法時會將其忽略,主要以徑向畸變?yōu)橹鳌?/p>
徑向畸變又有桶型畸變和枕型畸變兩種,投影設(shè)備產(chǎn)生圖像的徑向畸變最多的是桶型畸變。對于這種畸變的光學(xué)系統(tǒng),其空間直線在圖像空間中,除了對稱中心是直線以外,其他的都不是直線。人們進(jìn)行圖像矯正處理時,需要找到對稱中心,然后開始應(yīng)用計算機(jī)視覺算法進(jìn)行圖像的畸變矯正。
正常情況下,圖像畸變都是因?yàn)榭臻g狀態(tài)的扭曲而產(chǎn)生畸變,也被人們稱之為曲線畸變。過去人們使用二次多項(xiàng)式矩陣解對畸變系數(shù)加以掌握,但是一旦遇到情況復(fù)雜的圖像畸變,這種方式也無法準(zhǔn)確描述。如果多項(xiàng)式次數(shù)更高,那么畸變處理就需要更大矩陣的逆,不利于接下來的編程分析與求解計算。隨后人們提出了在BP 神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上的畸變矯正方式,其精度有所提高。本文以計算機(jī)視覺算法為基礎(chǔ),將該畸變矯正方式進(jìn)行深化,提出了卷積神經(jīng)網(wǎng)絡(luò)畸變圖像處理技術(shù)。與之前的BP 神經(jīng)網(wǎng)絡(luò)圖像處理技術(shù)相比,其權(quán)值共享網(wǎng)絡(luò)結(jié)構(gòu)和生物神經(jīng)網(wǎng)絡(luò)很相似,有效降低了網(wǎng)絡(luò)模型的難度和復(fù)雜程度,也減少權(quán)值數(shù)量,提高了畸變圖像的識別能力和泛化能力。
作為人工神經(jīng)網(wǎng)絡(luò)的一種,卷積神經(jīng)網(wǎng)絡(luò)可以使圖像處理技術(shù)更好的實(shí)現(xiàn)。卷積神經(jīng)網(wǎng)絡(luò)有著良好的稀疏連接性和權(quán)值共享行,其訓(xùn)練方式比較簡單,學(xué)習(xí)難度不大,這種連接方式更加適合用于畸變圖像的處理?;儓D像處理中,網(wǎng)絡(luò)輸入以多維圖像輸入為主,圖像可以直接穿入到網(wǎng)絡(luò)中,無需向過去的識別算法那樣重新提取圖像數(shù)據(jù)。不僅如此,在卷積神經(jīng)網(wǎng)絡(luò)權(quán)值共享下的計算機(jī)視覺算法能夠減少訓(xùn)練參數(shù),在控制容量的同時,保證圖像處理擁有良好的泛化能力。
如果某個數(shù)字化圖像的分辨率為227×227,將其均值相減之后,神經(jīng)網(wǎng)絡(luò)中擁有兩個全連接層與五個卷積層。將圖像信息轉(zhuǎn)化為符合卷積神經(jīng)網(wǎng)絡(luò)計算的狀態(tài),卷積神經(jīng)網(wǎng)絡(luò)也需要將分辨率設(shè)置為227×227.由于圖像可能存在幾何畸變,考慮可能出現(xiàn)的集中變形形式,按照檢測窗比例情況,將其裁剪為特定大小。
基于上述文中提到的計算機(jī)視覺算法,對畸變圖像模型加以確定。本文提出的圖像處理技術(shù)程序?qū)崿F(xiàn)應(yīng)用到了Matlab 軟件,選擇圖像處理樣本時以1000 幅畸變和標(biāo)準(zhǔn)圖像組為主。應(yīng)用了系統(tǒng)內(nèi)置Deep Learning 工具包,撰寫了基于畸變圖像算法的圖像處理與矯正程序,矯正時將圖像每一點(diǎn)在畸變圖像中映射,然后使用灰度差值確定灰度值。這種圖像處理方法有著低通濾波特點(diǎn),圖像矯正的精度比較高,不會有明顯的灰度缺點(diǎn)存在。因此,應(yīng)用雙線性插值法,在圖像畸變點(diǎn)周圍四個灰度值計算畸變點(diǎn)灰度情況。
當(dāng)圖像受到幾何畸變后,可以按照上文提到的計算機(jī)視覺算法輸入CNN 模型,再科學(xué)設(shè)置卷積與降采樣層數(shù)量、卷積核大小、降采樣降幅,設(shè)置后根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的內(nèi)容選擇輸出位置。根據(jù)灰度差值中雙線性插值算法,進(jìn)一步確定畸變圖像點(diǎn)位灰度值。隨后,對每一個圖像畸變點(diǎn)都采用這種方式操作,不斷重復(fù),直到將所有的畸變點(diǎn)處理完畢,最終就能夠在畫面中得到矯正之后的完整圖像。
為了盡可能的降低卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算的難度,降低圖像處理時間,建議將畸變矯正圖像算法分為兩部分。第一部分為CNN 模型處理,第二部分為實(shí)施矯正參數(shù)計算。在校正過程中需要提前建立查找表,并以此作為常數(shù)表格,將其存在足夠大的空間內(nèi),根據(jù)已經(jīng)輸入的畸變圖像,按照像素實(shí)際情況查找表格,結(jié)合表格中的數(shù)據(jù)信息,按照對應(yīng)的灰度值,將其替換成當(dāng)前灰度值即可完成圖像處理與畸變校正。不僅如此,還可以在卷積神經(jīng)網(wǎng)絡(luò)計算機(jī)算法初始化階段,根據(jù)位置映射表完成圖像的CMM 模型建立,在模型中進(jìn)行畸變處理,然后系統(tǒng)生成查找表。按照以上方式進(jìn)行相同操作,計算對應(yīng)的灰度值,再將當(dāng)前的灰度值進(jìn)行替換,當(dāng)所有畸變點(diǎn)的灰度值都替換完畢后,該畸變圖像就完成了實(shí)時畸變矯正,其精準(zhǔn)度較高,難度較小。
總結(jié):總而言之,隨著網(wǎng)絡(luò)技術(shù)與信息技術(shù)的日漸普及,傳統(tǒng)的模擬圖像已經(jīng)被數(shù)字化圖像取代,人們享受數(shù)字化圖像的高清晰度與真實(shí)度,但對于圖像畸變問題,還需要進(jìn)一步研究圖像的畸變矯正方法。在計算機(jī)視覺計算基礎(chǔ)上,本文采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像畸變計算,按照合理的灰度值計算,有效提高了圖像的清晰度,并完成了圖像的幾何畸變矯正。