隨著數(shù)字技術(shù)的不斷發(fā)展與應(yīng)用,現(xiàn)代教學(xué)活動中的許多信息都可以用數(shù)字形式的數(shù)據(jù)進行處理和存儲,數(shù)字圖像就是這種以數(shù)字形式進行存儲和處理的圖像。利用計算機可以對它進行常規(guī)圖像處理技術(shù)所不能實現(xiàn)的加工處理,可以多次拷貝而不失真。
數(shù)字圖像信息的采集及其描述
要獲得一個數(shù)字圖像必須將圖像中的像素轉(zhuǎn)換成數(shù)字信息,以便在計算機上進行處理和加工。將模擬圖像轉(zhuǎn)換成數(shù)字圖像的工作,通常可由掃描儀來完成。掃描儀測量從圖片發(fā)出或反射的光,依次記錄光點的數(shù)值并產(chǎn)生一個彩色或黑白的數(shù)字拷貝。這個圖像被翻譯成一系列的數(shù)字后存儲在計算機的硬盤上或者其他的電子介質(zhì)上。掃描的過程即由模擬原稿實現(xiàn)數(shù)字化的處理過程。
實際上,圖像的數(shù)字化包含兩個方面的內(nèi)容,它們是空間位置的離散和數(shù)字化以及亮度的離散和數(shù)字化。從不很精確的角度敘述,可將空間位置的離散稱為抽樣,而亮度的數(shù)字化稱為量化。
數(shù)字圖像處理的特點
1.數(shù)字圖像處理的信息大多是二維信息,處理信息量很大。如一幅256×256低分辨率黑白圖像,要求約64kbit的數(shù)據(jù)量;對高分辨率彩色51×512圖像,則要求768kbit數(shù)據(jù)量;如果要處理3幀/秒的電視圖像序列,則每秒要求500kbit~22.Mbit數(shù)據(jù)量。因此對計算機的計算速度、存儲容量等要求較高。
2.數(shù)字圖像處理占用的頻帶較寬。與語言信息相比,占用的頻帶要大幾個數(shù)量級。如電視圖像的帶寬約5.6MHz,而語音帶寬僅為4kHz左右,所以在成像、傳輸、存儲、處理、顯示等各個環(huán)節(jié)的實現(xiàn)上,技術(shù)難度較大,成本亦高,這就對頻帶壓縮技術(shù)提出了更高的要求。
3.數(shù)字圖像中各個像素是不獨立的,其相關(guān)性大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達0.9以上,而相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性一般來說還要大些。因此,圖像處理中信息壓縮的潛力很大。
4.由于圖像是三維景物的二維投影,一幅圖像本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫面上是反映不出來的。因此,要分析和理解三維景物必須作合適的假定或附加新的測量,例如雙目圖像或多視點圖像。
5.數(shù)字化處理后的圖像一般是給人觀察和評價的,因此受人的因素影響較大。由于人的視覺系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺性能、知識狀況等影響很大,作為圖像質(zhì)量的評價還有待進一步深入的研究。另一方面,計算機視覺是模仿人的視覺,人的感知機理必然影響著計算機視覺的研究。
掃描后的數(shù)字化圖像的處理
一般來說,掃描得到的圖像還存在諸如文檔變形、畸變等一些問題(常見的畸變分桶形畸變和枕形畸變),在一些教學(xué)場所應(yīng)用的低成本攝像頭更是普遍存在光學(xué)畸變。即使對圖像進行了諸如去除波紋圖案、增加圖像亮度對比度等一系列的處理后,也只能是一定程度的增強圖像的質(zhì)量,若將得到的初步處理后的數(shù)字圖像直接應(yīng)用于教學(xué)活動肯定還會存在一些問題,這就需要在圖像處理的后期工作中加入圖像的矯正處理。
由于實時的教學(xué)環(huán)節(jié)對圖像矯正速度提出較高的要求,我們必須找出一種應(yīng)對圖像的畸變校正的快速算法,通過大量的交流與試驗,針對現(xiàn)代教學(xué)活動中產(chǎn)生的數(shù)字圖像進行分析得到大背景小目標(biāo)的定性檢測,可以采用一種基于針對各像素的坐標(biāo)插值的查表法,直接建立畸變前后圖像坐標(biāo)位置的近似對應(yīng)關(guān)系。這種方法的特點是圖像的目標(biāo)區(qū)域小,對應(yīng)的攝像頭像素少,實時計算時矯正速度快,效果較好。
基對應(yīng)點是查找表的基本框架,首先固定攝像頭,然后將標(biāo)準(zhǔn)的柵格圖形的柵格按行編號(或按列編號),設(shè)x、y坐標(biāo)矩陣分別為:
攝像頭拍得的畸變圖像如圖2所示,與未畸變圖對應(yīng)柵格點坐標(biāo)為:
利用標(biāo)準(zhǔn)圖形坐標(biāo)值,分別對X,Y,X′,Y′進行線性插值(二次插值、三次樣條插值等與之相似,為簡單說明問題,以線性插值為例),分別求出所有點的坐標(biāo)。
行插值:設(shè)k=[xi,j+1-xi,j](取整),k為兩點間需要插值的最小點數(shù)。則坐標(biāo)插值程序為:
For i=1∶m
For j=1∶n
Temp=X(i,j)∶(X(i,j+1)-X(i,j))/k∶X(i,j+1
Foru=1∶k
Xnew(i,(j-1)*k+u)=Temp(u);
End
End
End
列插值:設(shè)t=[xi+1,j-xi,j](同樣取整),t的要求同k一樣。
得到新的矩陣:
同理可得Ynew,X′new,Y′new。即畸變后的圖像各點對應(yīng)的畸變前坐標(biāo)。
針對大背景小目標(biāo)的定性檢測,本文提出了一種低成本、小數(shù)據(jù)量的新型機器視覺成像系統(tǒng)以及基于坐標(biāo)插值的攝像頭畸變軟件矯正算法。這種系統(tǒng)成本低、目標(biāo)區(qū)域精度高而總體數(shù)據(jù)量少,它的圖像矯正算法簡單可行,沒有復(fù)雜的計算式,提高了目標(biāo)圖像的質(zhì)量和整體的運算速度,可以用于目標(biāo)的定性識別。