吳雨迪
(廣州市第十六中學(xué),廣東 廣州 510000)
計算機(jī)視覺技術(shù)是指利用攝像頭等輸入設(shè)備充當(dāng)人類眼睛獲取圖像信息,并采取一系列圖像處理算法對輸入圖像進(jìn)行研究、分析,提取出有用信息并給出反饋的一種技術(shù),是人工智能的一個重要分支。隨著計算機(jī)視覺技術(shù)的迅猛發(fā)展,攝像機(jī)已經(jīng)廣泛應(yīng)用于人類工作、生活的各個方面,例如視頻監(jiān)控、人機(jī)交互、車牌識別、路標(biāo)檢測、行人檢測等,尤其是隨著人們對無人駕駛智能車需求的日益增長,基于攝像頭的目標(biāo)檢測成為了當(dāng)下研究的熱門方向。伴隨著視頻監(jiān)控網(wǎng)絡(luò)的不斷壯大,單攝像頭目標(biāo)檢測逐漸被多攝像頭接力目標(biāo)追蹤檢測所替代。如何利用計算機(jī)視覺技術(shù)代替人工,實(shí)現(xiàn)多個攝像頭之間目標(biāo)的接力檢測追蹤,已經(jīng)成為目前視頻檢測中的一個關(guān)鍵問題。典型的多攝像頭接力追蹤過程如圖1 所示。
圖1 多攝像頭接力追蹤示意圖
現(xiàn)如今,隨著時代的發(fā)展,公共安全面臨著越來越多的考驗(yàn)與挑戰(zhàn)。公共環(huán)境下的智能監(jiān)控技術(shù)是保障公共場合安全性的一個重要手段和途徑,其關(guān)鍵在于如何在大量大攝像頭提取的視頻中找出指定的犯罪嫌疑人,并且對其進(jìn)行實(shí)時、連續(xù)接力追蹤。該項(xiàng)技術(shù)的發(fā)展,可以為公共財產(chǎn)安全或人們的公共生命安全提供保障,同時也能為公安部門的案件審理提供有效的技術(shù)支持。
隨著數(shù)字化、信息化時代的到來,一些智能家居產(chǎn)品逐漸走入人們的生活。由于單個攝像頭的范圍有限,而居住環(huán)境相對復(fù)雜,所以對多個居室的住宅而言,需要多個攝像頭協(xié)同合作,對某個特定用戶進(jìn)行接力追蹤識別,才能有效地為后續(xù)指令動作的讀取奠定基礎(chǔ),從而可以在不同的房間對某智能家居發(fā)布指令,并進(jìn)行控制。
多攝像頭在智能交通中發(fā)揮著巨大的作用,其可以應(yīng)用在無人車自動駕駛領(lǐng)域,通過不同地點(diǎn)不同攝像頭的協(xié)調(diào)工作,調(diào)度無人車行駛路徑。其也可以應(yīng)用在肇事車輛的追蹤中,為公安部門破案節(jié)省大量財力物力人力。
完整的多攝像頭接力跟蹤包括目標(biāo)定位、單攝像頭機(jī)內(nèi)追蹤和多攝像頭間交接三個部分。
目標(biāo)定位是根據(jù)目標(biāo)描述確定目標(biāo)的位置,是多攝像頭接力跟蹤的初始步驟。在實(shí)際應(yīng)用中,多采用目標(biāo)檢測算法進(jìn)行目標(biāo)初始定位,包括靜態(tài)背景下的目標(biāo)檢測和復(fù)雜背景下的目標(biāo)檢測。
靜態(tài)背景下目標(biāo)檢測多采用差分法、模板匹配法、減除背景法。差分法的理論依據(jù)是靜態(tài)背景的像素值不會發(fā)生變化,所以可以讀取每一幀的像素,根據(jù)幀與幀之間像素的差確定背景之中的目標(biāo)。模板匹配法是提取圖片的某些特征,例如顏色特征、直方圖特征、Haar 特征等,與檢測目標(biāo)的特征進(jìn)行匹配,從而檢測出目標(biāo)。減除背景法則是用當(dāng)前幀的像素值減去該背景的像素模型,從而定位目標(biāo)。
復(fù)雜背景下的目標(biāo)檢測包括運(yùn)動背景下的目標(biāo)檢測和大場景下目標(biāo)檢測。運(yùn)動背景下的目標(biāo)檢測考慮到攝像頭會隨著時間或物體運(yùn)動而發(fā)生旋轉(zhuǎn)、平移等變化,拍攝的背景也會隨之而變化。大場景下目標(biāo)檢測則是需要多個攝像頭對大區(qū)域進(jìn)行拍攝。無論是運(yùn)動背景下的目標(biāo)檢測還是大場景下的目標(biāo)檢測,都需要利用一定的算法對背景進(jìn)行估計和補(bǔ)償,將一系列拍攝所得的背景圖像拼接為完整的背景,然后再根據(jù)每一幀的像素鎖定背景區(qū)域,實(shí)現(xiàn)目標(biāo)的定位。
一旦目標(biāo)確定,為了實(shí)現(xiàn)在多個攝像頭之間對該目標(biāo)進(jìn)行追蹤,首先要實(shí)現(xiàn)在單攝像頭內(nèi)進(jìn)行穩(wěn)定準(zhǔn)確的目標(biāo)跟蹤。通常利用運(yùn)動估計來實(shí)現(xiàn)。常用的運(yùn)動估計算法包括:①遍歷搜索。最經(jīng)典的遍歷搜索算法是示例學(xué)習(xí)跟蹤(MIL),該算法預(yù)設(shè)目標(biāo)出現(xiàn)在前一幀圖像某臨近區(qū)域內(nèi)的概率相同,在下一幀的檢測中遍歷該區(qū)域,從而獲得目標(biāo)位置。②概率高斯模型。該算法以前一幀圖像目標(biāo)位置為中心,利用高斯概率密度函數(shù)對下一幀的目標(biāo)進(jìn)行鎖定。③光流法。光流法是由Gibson 最早提出的,它是根據(jù)視頻流中像素強(qiáng)度的時域變化來確定各個像素的‘運(yùn)動’情況,從而分析出目標(biāo)的運(yùn)動。
多攝像頭間接力追蹤需要將一個攝像頭內(nèi)鎖定的目標(biāo)正確地‘交接’給另一攝像頭。其技術(shù)難點(diǎn)在于:①不同攝像頭由于位置、角度、光照等外在因素,或鏡頭色差等內(nèi)在因素的差異,導(dǎo)致了統(tǒng)一目標(biāo)在不同攝像頭間的特征參數(shù)有所不同。②攝像機(jī)只能獲取二維信息,目標(biāo)時空信息無法獲取。③由于攝像機(jī)的差異性,噪聲的來源、種類、特性也各不相同,視頻幀的預(yù)處理難度增大。
一般情況下,多攝像頭的交接跟蹤分為有重疊視覺區(qū)域的多攝像機(jī)目標(biāo)跟蹤和無重疊視覺區(qū)域的多攝像機(jī)目標(biāo)跟蹤。有重疊視覺區(qū)域的多攝像機(jī)目標(biāo)跟蹤可以利用不同攝像機(jī)內(nèi)的重疊區(qū)域進(jìn)行標(biāo)定,其核心思想是建立不同攝像機(jī)之間的三維拓?fù)潢P(guān)系。該方法通過攝像頭獲得其周圍環(huán)境信息,通過映射函數(shù)將某一攝像機(jī)坐標(biāo)下的目標(biāo)信息映射到另一攝像機(jī)的坐標(biāo)中。該算法只利用了攝像機(jī)間的位置信息,沒有利用目標(biāo)物體的特征模型,是一種計算復(fù)雜度相對較低的方法。
無重疊視覺區(qū)域的多攝像機(jī)目標(biāo)跟蹤中存在視覺盲區(qū),難度比有重疊視覺區(qū)域的追蹤要大得多。由于攝像機(jī)間視野不重疊,多個攝像機(jī)的相對位置關(guān)系難以確定,無法在視覺交界處進(jìn)行目標(biāo)的傳遞。因此,在這種情況下,多采用基于目標(biāo)特征匹配的算法。例如,可利用顏色直方圖進(jìn)行目標(biāo)匹配,或是利用紋理和形狀特征來建立模型,最大化概率關(guān)聯(lián)融合器(JPDAF)來進(jìn)行跨越視野的追蹤。不同攝像機(jī)所處環(huán)境的不同導(dǎo)致了目標(biāo)特征的選取存在一定困難,容易引起特征提取不準(zhǔn)確、不完整。同時,同一目標(biāo)特征模型的參數(shù)在不同攝像機(jī)下也不盡相同,進(jìn)一步加大了多攝像機(jī)交接的困難,該類算法的計算復(fù)雜度相對較高。
目前,Cai、Chang 等人采取了位置信息與目標(biāo)特征匹配相結(jié)合的算法,該算法綜合了兩者的優(yōu)點(diǎn),充分利用了環(huán)境監(jiān)理攝像機(jī)的拓?fù)湮恢藐P(guān)系,并且提取了目標(biāo)的特征,最后利用適合的并聯(lián)算法對不同攝像機(jī)發(fā)現(xiàn)的目標(biāo)進(jìn)行對應(yīng),是一種結(jié)尾有效的方法。
多攝像機(jī)接力追蹤問題經(jīng)過了幾十年來大量科研人員的不懈努力已經(jīng)取得了一定的進(jìn)展。常用方法是將其拆分為目標(biāo)定位、攝像頭內(nèi)目標(biāo)跟蹤和攝像機(jī)間交接三個部分。其中目標(biāo)定位多采用特征提取結(jié)合特征匹配的方法,攝像機(jī)內(nèi)目標(biāo)跟蹤多采用運(yùn)動估計法,而攝像機(jī)間的目標(biāo)交接則根據(jù)有無重疊區(qū)域分為基于空間約束拓?fù)湮恢藐P(guān)系的算法和基于特征匹配的算法等。目前仍然存在一定的困難,上述各類算法都是以單攝像頭內(nèi)目標(biāo)跟蹤為基礎(chǔ),單攝像頭內(nèi)的目標(biāo)追蹤尚存在未能解決的難點(diǎn),例如攝像頭本身產(chǎn)生的噪聲、清晰度等;物體的復(fù)雜性特異性、被樹木或是周圍環(huán)境遮擋、物體運(yùn)動時發(fā)生姿態(tài)變化等;周圍環(huán)境光照變化等。多攝像頭的接力追蹤覆蓋的范圍更為廣闊,攝像機(jī)之間的拓?fù)浣Y(jié)構(gòu)往往比較復(fù)雜,它面臨著更多新的問題。
在未來發(fā)展中,我們可以考慮用新的更加準(zhǔn)確的特征來描述復(fù)雜的目標(biāo)物體,還可以引入機(jī)器學(xué)習(xí)算法如boosting算法,甚至可以考慮引入目前最流行的卷積神經(jīng)網(wǎng)絡(luò)算法來提高目標(biāo)追蹤的準(zhǔn)確性和確定性,未來硬件設(shè)備也會進(jìn)一步發(fā)展。