周晶瑩
摘要:文章利用最小二乘法、迭代法、遍歷法,結(jié)合MATLAB編程解決了如何在客觀環(huán)境限制條件下判斷當(dāng)前視野區(qū)域運(yùn)動(dòng)方向的問題,得到了一系列從一維到三維運(yùn)動(dòng)方向的判斷方法。首先利用MATLAB得到所選圖像的灰度值矩陣,然后根據(jù)一定原則選取5個(gè)特征域,再比較前后兩張圖像的位置對應(yīng)關(guān)系,最終通過迭代法推斷出視野區(qū)域的運(yùn)動(dòng)方向。關(guān)鍵詞:最小二乘;迭代;特征域
1 問題描述
隨著數(shù)碼攝像技術(shù)不斷發(fā)展,對于計(jì)算機(jī)技術(shù)和自動(dòng)化技術(shù)的要求也越來越高。通過選取圖像特征域并比較其前后位置對應(yīng)關(guān)系,推斷出較為真實(shí)目可靠的視野區(qū)域運(yùn)動(dòng)方向。
2 模型的建立
2.1 基本假設(shè)
(1)拍攝的整個(gè)場景的狀態(tài)是穩(wěn)定靜態(tài)的;(2)整個(gè)場景的光源是充足均勻的;(3)低分辨率成像,分辨率為32X64;(4)圖像為黑白單色圖像;(5)拍攝圖像的時(shí)間間隔是一定的;(6)視野區(qū)域是緩慢勻速移動(dòng)的;(7)圖像是實(shí)時(shí)上傳至計(jì)算機(jī)且快速處理的。
2.2 符號說明
2.3 圖像預(yù)處理
首先利用MATLAB的imread()函數(shù)讀取圖像,即將所攝圖像數(shù)字化,轉(zhuǎn)化為圖像文件數(shù)據(jù)。然后通過rgb2ntsc()函數(shù)對圖像轉(zhuǎn)換為NTSC模式,得到一個(gè)二維數(shù)組構(gòu)成的灰度值矩陣Gi[gmn],這個(gè)矩陣存儲(chǔ)著每個(gè)像素對應(yīng)格子的亮度平均值,即灰度值信息。假設(shè)矩陣元素值為1表示白色,0表示黑色,圖像的顏色均處在黑白或黑白之間,圖像數(shù)字化后的數(shù)字范圍在0~1之間。
其中,Gi為第i張圖像的灰度值矩陣。
2.4 推斷運(yùn)動(dòng)方向Vi+1
視野區(qū)域在三維空間內(nèi)運(yùn)動(dòng)時(shí),其反映在所攝圖像上最明顯的是邊界和中心區(qū)域的變化,可以在4個(gè)邊界及中心位置選取5個(gè)特征域作為判斷運(yùn)動(dòng)方向的依據(jù)。由于視野區(qū)域是緩慢運(yùn)動(dòng),可假定視野左右、上下移動(dòng)的平移量不超過圖像長度的1/4,并選取具有代表性的中心位置作為中間特征域。根據(jù)上述選取特征域的原則,在每個(gè)第i張圖像的灰度值矩陣Gi上選取出這5個(gè)特征域,再對第i+1張圖像的灰度值矩陣Gi+1從g11開始進(jìn)行遍歷,利用最小二乘的原理,得到每個(gè)特征域在第i+1張圖像上的1個(gè)最優(yōu)位置和4個(gè)較優(yōu)位置。
公式1最小二乘公式為:
由于某個(gè)特征域在視野區(qū)域移動(dòng)后可能會(huì)出現(xiàn)丟失的情況,需要先對利用最小二乘法得到的最優(yōu)解進(jìn)行然閾值判斷。經(jīng)多次編程試驗(yàn)結(jié)果表明,對于邊界特征域?qū)㈤撝翟O(shè)置為1,對于中心特征域?qū)㈤撝翟O(shè)置為0.1,能夠較為精確判斷出特征域是否丟失。若最優(yōu)解結(jié)果大于閾值,就假定某特征域完全消失;若最優(yōu)解小于閾值,那么就表明該特征域仍在后一張圖像中,并在4個(gè)較優(yōu)解中選取與最優(yōu)解相差不超過20%作為次優(yōu)解,再將最優(yōu)解和次優(yōu)解的結(jié)果進(jìn)行加權(quán)平均進(jìn)行二次判斷,最后確定出特征域在后一張圖像中的具體位置。由于視野區(qū)域的位移量不一定以像素的整數(shù)倍運(yùn)動(dòng),為了提高精確率,可利用最優(yōu)解和次優(yōu)解的加權(quán)平均進(jìn)行判斷來有效的減少誤差。
通過以上步驟,判斷出5個(gè)特征域?qū)?yīng)的位置變化,并結(jié)合這5個(gè)特征域的位置變化得出較為精確的確定出第i張圖像的運(yùn)動(dòng)方向Vi(xi,yi,zi,θi,φi,γi)。
2.5 確定視野區(qū)域運(yùn)動(dòng)方向
由第一張和第二張圖像的特征域位置變換的分析結(jié)果可以確定一個(gè)運(yùn)動(dòng)方向V1(x1,y1,z1,θ1,φ1,γ1),繼續(xù)迭代第三張圖像,把其x,y軸的平移量與前兩張圖片所確定的平移方向先加權(quán)平均,再求得新的運(yùn)動(dòng)方向V2(x2,y2,z2,θ2,φ2,γ2),并將|θ2-θ1|作為兩個(gè)運(yùn)動(dòng)方向之間的誤差。經(jīng)過多次試驗(yàn)結(jié)果分析,誤差在π/60以內(nèi)屬于合理誤差標(biāo)準(zhǔn)。如果符合誤差標(biāo)準(zhǔn),則第三張圖像確定的運(yùn)動(dòng)方向V2(x2,y2,z2,θ2,φ2,γ2)即最終的視野區(qū)域運(yùn)動(dòng)方向,否則,繼續(xù)迭代下一張圖像直至|θ2-θ1|<(π/60)即符合誤差標(biāo)準(zhǔn),則運(yùn)動(dòng)方向和視野區(qū)域的運(yùn)動(dòng)方向?yàn)閂i+1(xi+1,yi+1,zi+1,θi+1,φi+1,γi+1)。
2.6 運(yùn)動(dòng)方向討論
在整個(gè)三維空間中建立空間直角坐標(biāo)系xyz,其中x表示左右方向,v表示上下方向,z表示前后方向。
2.6.1 一維平移運(yùn)動(dòng)
一維平移運(yùn)動(dòng)即視野區(qū)域沿著平行于某一條坐標(biāo)軸的方向運(yùn)動(dòng),一共分為向左、向右、向上、向下、向前、向后6種運(yùn)動(dòng)形式,且各個(gè)運(yùn)動(dòng)形式是互斥的。根據(jù)5個(gè)特征域的位置變換情況,就可以較為準(zhǔn)確地判斷視野區(qū)域運(yùn)動(dòng)方向。具體分析如表1所示。
2.6.2 二維平移運(yùn)動(dòng)
二維平移運(yùn)動(dòng)即視野區(qū)域在平面內(nèi)運(yùn)動(dòng),且與坐標(biāo)軸有一定的夾角。與一維平移運(yùn)動(dòng)一樣,可以根據(jù)5個(gè)特征域的位置變化情況,得到視野區(qū)域的運(yùn)動(dòng)方向。示例部分結(jié)果如圖1-2所示。
2.6.3 三維平移運(yùn)動(dòng)
三維平移運(yùn)動(dòng)即視野區(qū)域在整個(gè)空間中運(yùn)動(dòng),存在3個(gè)方向上的分量。由于未知實(shí)際景象在圖像中的縮放程度和拍攝間隔的時(shí)間,不能直接根據(jù)特征域移動(dòng)的像素距離來判斷出視野區(qū)域具體向各個(gè)方向上的運(yùn)動(dòng)速度。當(dāng)視野區(qū)域存在向前或向后的平移時(shí),雖無法得出其在平面內(nèi)運(yùn)動(dòng)的具體角度,但可通過對二維平移運(yùn)動(dòng)的結(jié)果分析,得到前后、上下、左右運(yùn)動(dòng)的相對運(yùn)動(dòng)速度快慢,并能確定運(yùn)動(dòng)方向投影在平面內(nèi)的角度的弧度值。由此在一維、二維平移運(yùn)動(dòng)的基礎(chǔ)上可以分析出三維平移運(yùn)動(dòng)的運(yùn)動(dòng)方向。
3 結(jié)語
基于“計(jì)算機(jī)視覺”從復(fù)雜變化的背景環(huán)境中準(zhǔn)確識(shí)別出目標(biāo)物體運(yùn)動(dòng)的技術(shù)在生活中具有廣泛應(yīng)用,例如:可用于對安全性比較敏感的智能視頻監(jiān)控系統(tǒng),通過對實(shí)時(shí)圖像幀的分析可以分辨出監(jiān)控下目標(biāo)物體的具體行為,以達(dá)到監(jiān)控的目的;其次可以以此為基礎(chǔ)研發(fā)智能交通檢測系統(tǒng),以便運(yùn)用在測試事故現(xiàn)場車輛行為、車輛測速、交通流量監(jiān)控等場合;最后還可以進(jìn)一步與人工智能技術(shù)相結(jié)合,為人機(jī)交互的機(jī)器人技術(shù)的發(fā)展奠定基礎(chǔ)。
可以說,基于圖像目標(biāo)物體運(yùn)動(dòng)識(shí)別技術(shù)是各種自動(dòng)化技術(shù)和計(jì)算機(jī)技術(shù)未來發(fā)展的關(guān)鍵底層技術(shù),如果可以進(jìn)一步深化文章的研究模型并與其他計(jì)算機(jī)技術(shù)聯(lián)合起來,則將會(huì)有更好的發(fā)展前景,具有很強(qiáng)的現(xiàn)實(shí)意義。