王 賓,韓群勇
(漳州職業(yè)技術(shù)學(xué)院 電子工程學(xué)院, 福建 漳州 363000)
人機(jī)交互在生活的各個方面起到重要作用,如醫(yī)療、軍事、交通等,近些年專家們對無人機(jī)操作方面的應(yīng)用進(jìn)行了廣泛研究.無人機(jī)進(jìn)行作業(yè)時,有賴于對目標(biāo)人體姿勢的有效識別.而實(shí)現(xiàn)該主動視覺交互功能的基礎(chǔ)是準(zhǔn)確操作無人機(jī)面向人體,即對人體朝向進(jìn)行準(zhǔn)確估計[1-2].僅僅依靠無人機(jī)中的移動相機(jī)并不能很好地實(shí)現(xiàn)該目標(biāo),因?yàn)槿梭w可能會進(jìn)行出乎意料的移動,并且場景范圍廣,環(huán)境變化大,如光照、視覺角度等.因此,如何準(zhǔn)確估計人體朝向是無人機(jī)研究的熱點(diǎn).
為了克服環(huán)境的影響,目前常用的方法為先提取相關(guān)低級特征描述符,如尺度不變特征轉(zhuǎn)換[3]、梯度方向直方圖[4]等表示人體朝向特征,然后利用支持向量機(jī)[5]、神經(jīng)網(wǎng)絡(luò)[6]等方法對提取特征進(jìn)行分類,得到人體朝向標(biāo)簽.同時一些研究者考慮頭部與身體的關(guān)系,將兩者進(jìn)行有機(jī)結(jié)合,利用身體形狀的先驗(yàn)信息提高人體朝向評估性能[7].由于航拍圖像的局限性,容易受外界環(huán)境影響,所以僅僅利用低級的視覺外觀特征不足以實(shí)現(xiàn)理想的評估結(jié)果.
為了獲得魯棒性更好的視覺外觀模型特征,很多研究者對提取的低級特征進(jìn)行再訓(xùn)練,然后進(jìn)行反饋,使得在目標(biāo)跟蹤過程中可以持續(xù)對外觀模型進(jìn)行更新[8].由于無人機(jī)需要針對每個場景中的所有可能人體朝向進(jìn)行評價,導(dǎo)致數(shù)據(jù)量很大.
本文將目標(biāo)人體朝向體位分為8種:后左、左、前左、前、前右、右、后右、后,標(biāo)簽y和對應(yīng)的圖像s,其訓(xùn)練過程如圖1所示.輸入為圖像分塊的集合s,對應(yīng)已知的表示身體朝向的標(biāo)簽y∈{y1,...,y8},用遙測數(shù)據(jù)集x對每個圖像分塊進(jìn)行標(biāo)注.訓(xùn)練具體步驟為:首先為每個標(biāo)簽采集一組遙測數(shù)據(jù)集,得到每個傳感器度數(shù)的隱性狀態(tài)特征,然后使用隱條件隨機(jī)域方法選擇重要程度最高的特征,最后輸出參數(shù)集Λ*={λ1,...,λ5},其中λn為第n階交互的最優(yōu)參數(shù).
本文算法的目標(biāo)是計算測試數(shù)據(jù)與訓(xùn)練存儲的外觀視覺模型相關(guān)性最大化,如式(1)所示.
(1)
式中μst為已知標(biāo)簽y的外觀模型;函數(shù)N(·)用于對已知模型和圖像分塊的窗口尺寸進(jìn)行歸一化.在實(shí)際應(yīng)用中,每隔幾幀便會生成視覺外觀模型,這將導(dǎo)致龐大的選擇模型集,計算困難.由于每個模型均對應(yīng)與其相關(guān)聯(lián)的遙測數(shù)據(jù),所以,模型的選擇可以投影到遙測數(shù)據(jù)上.對于指定場景觀測到的遙測數(shù)據(jù),在訓(xùn)練集中找到與該場景特征相似度最高的實(shí)例.在模型選擇過程中,所有遙測數(shù)據(jù)特征元素的貢獻(xiàn)并不相同,且對于一個標(biāo)簽,這些特征元素也不是相互獨(dú)立.針對該問題,本文基于隱動態(tài)條件隨機(jī)域,對遙測數(shù)據(jù)中的隱相關(guān)性進(jìn)行建模,從而快速實(shí)現(xiàn)視覺外觀模型子集的選擇.
圖1 訓(xùn)練過程示意圖
圖2 測試過程流程圖
條件隨機(jī)域[10](Condition Random Fields,CRF)是對非定向圖形模型中相關(guān)性進(jìn)行編碼的較為簡便的模型.CRF模型的能力依賴于特征函數(shù)的數(shù)量和質(zhì)量.本文通過向每個局部觀測xi中添加隱變量hi來提高CRF模型的性能,使可能狀態(tài)的范圍顯著縮減.同時,對判別特征函數(shù)進(jìn)行動態(tài)選擇,并使用Akaike信息準(zhǔn)則[11]對視覺外觀模型進(jìn)行關(guān)聯(lián).
考慮一個圖形模型G= (V,E),其中V是M個節(jié)點(diǎn)的集合,每個節(jié)點(diǎn)對應(yīng)于一個特定的遙測測量信息xi;同時定義遙感測量值xi的任意組合為信息組,E是不同信息組之間邊緣的集合.本文研究包括5個傳感器遙感測量信息:高度x1、萬向角x2、時刻x3、磁航向x4和GPS定位x5.5個傳感器信息上的隱性條件隨機(jī)域的結(jié)構(gòu)如圖3所示.
圖3 在5個傳感器信息上的隱性條件隨機(jī)域結(jié)構(gòu)
本文目標(biāo)是對于已知標(biāo)簽,利用{xi}的交互信息表示任何人體朝向模型,如公式(2)所示.
在現(xiàn)行的多版本教材中,都將“用字母表示數(shù)”作為“方程”這一課時的前提知識來編排。從知識結(jié)構(gòu)來講,有其合理性。因?yàn)榉匠讨斜厝簧婕拔粗獢?shù)的表達(dá)和運(yùn)算,因此,提前學(xué)習(xí)“用字母表示數(shù)”會有助于學(xué)生更快掌握方程內(nèi)容。
(2)
(3)
每個參數(shù)θk的值受數(shù)據(jù)x的稀疏性影響,提高稀疏性可優(yōu)化條件隨機(jī)域結(jié)構(gòu)的表達(dá)能力,對于隱馬爾科夫模型[14](Hidden Markov Models,HMM)和動態(tài)貝葉斯網(wǎng)絡(luò)(Dynamic Bayesian Networks,DBN)[15]的研究說明,增加隱變量的集合可以提高數(shù)據(jù)稀疏性.
條件隨機(jī)域模型的主要優(yōu)勢在于特征函數(shù)的靈活性,隱性狀態(tài)的任何可能形態(tài)均可用于測量.如果觀測到的信息分布密集,那么特征函數(shù)的區(qū)分價值就會變小.對于遙感測量數(shù)據(jù),每個局部觀測范圍較大,如GPS節(jié)點(diǎn)獲得的經(jīng)緯度信息x5的分辨率小于1米,對如此密集的分布構(gòu)建關(guān)聯(lián)模型效率很低.因此,對每個節(jié)點(diǎn)xi引入相應(yīng)隱變量hi,使得hi=Ω(xi),其中映射函數(shù)Ω(·)為增加稀疏性的任意映射函數(shù),如聚類等.本文使用一個預(yù)定義數(shù)量的集群對每個局部測量值進(jìn)行聚類.定義隱變量集合h={h1,...,hM},其中每個隱變量hi均是對測量值xi的稀疏映射獲得.通過引入隱變量,對公式(2)的標(biāo)準(zhǔn)條件隨機(jī)域進(jìn)行轉(zhuǎn)變,如公式(4)所示.
(4)
(5)
(6)
(7)
式中,kcn是n個節(jié)點(diǎn)交互參數(shù)的特征指標(biāo)集合.相關(guān)性分析的主要缺點(diǎn)是條件隨機(jī)域模型不易擴(kuò)展.如果決策邊界過于復(fù)雜,區(qū)別標(biāo)簽的有效方法是將問題投影到更高維,該維度考慮到更遠(yuǎn)范圍的相關(guān)性.下面將對訓(xùn)練過程中所有可能的特征進(jìn)行選擇和評價,以獲得高辨識度特征.
通過使用隱條件隨機(jī)域增加測量數(shù)據(jù)的稀疏性,提高特征描述能力,但并不是所有的特征均同樣重要,所以需要對重要特征進(jìn)行選擇.本文使用改進(jìn)的Akaike信息準(zhǔn)則,選擇提高數(shù)據(jù)條件對數(shù)似然性的特征,抑制過擬合的特征,Akaike信息準(zhǔn)則的定義如公式(8)所示.
(8)
式中,k表示每個相關(guān)性范圍所含的參數(shù)數(shù)量;L表示相應(yīng)特征函數(shù)的似然最大值.Akaike信息準(zhǔn)則認(rèn)為:如果已知隱性條件隨機(jī)域模型的真實(shí)分布,則能夠利用度量方法準(zhǔn)確計算信息丟失情況,如Kullback-Leibler距離.本文在特征選擇之前和之后,利用Akaike信息準(zhǔn)則的得分A對相關(guān)信息進(jìn)行度量.
為了最大化條件似然項(xiàng),在已知第t個訓(xùn)練樣本的似然項(xiàng)時,本文利用使用BFGS梯度上升方法,如公式(9)所示.
(9)
其中,取Lt(Λ)相對于一元參數(shù)的導(dǎo)數(shù),如公式(10)所示.
(10)
本實(shí)驗(yàn)的數(shù)據(jù)來自100次的無人機(jī)飛行采集.在每次飛行過程中,無人機(jī)在目標(biāo)人體周圍以八邊形軌跡,采用不同的離地高度、萬向角、磁航向、定位和時刻來飛行.在數(shù)據(jù)采集時,目標(biāo)人類定位于一個預(yù)定義的八邊形中心,無人機(jī)從八邊形各個角落得到目標(biāo)人體的8個視覺外觀模型.本實(shí)驗(yàn)對遙測數(shù)據(jù)的特征組合進(jìn)行評價,并與傳統(tǒng)的條件隨機(jī)域和支持向量機(jī)方法進(jìn)行比較.
表1 8種朝向標(biāo)簽的混淆矩陣
本文的主要目標(biāo)是使用從場景獲得的非視覺信息對視覺外觀特征進(jìn)行表征,實(shí)質(zhì)是觀察到的遙測數(shù)據(jù)和可用的遙測模型之間的匹配,需要利用有效的距離度量方法.為了描述階數(shù)更高交互的重要性,將本文隱動態(tài)條件隨機(jī)域方法與僅使用遙測數(shù)據(jù)和視覺外觀模型之間的支持向量機(jī)方法和條件隨機(jī)域方法的識別結(jié)果進(jìn)行比較,具體數(shù)據(jù)如圖4所示.可以看出,本文方法的性能最好,其剔除了冗余無效甚至?xí)a(chǎn)生負(fù)作用的特征,充分利用具有高度辨識性的特征,能夠快速高效選擇正確模型.條件隨機(jī)域性能差一些,因?yàn)槠淙哂嗵卣鞯臄?shù)量過大,特征分布過于密集,使決策標(biāo)簽邊界過于復(fù)雜.支持向量機(jī)表現(xiàn)最差,主要原因是未充分利用決策標(biāo)簽邊界的高辨識特征.
本文提出一種新的無人機(jī)識別人體朝向的方法,將非視覺場景特征與8種人體朝向的模型相結(jié)合.本文方法能夠?qū)δ繕?biāo)人體朝向進(jìn)行準(zhǔn)確估計,然后通過自動操控面向人體正面.該方法利用遙測數(shù)據(jù)特征間的交互信息,使用隱性動態(tài)條件隨機(jī)域解決視覺外觀模型分類問題.根據(jù)所有特征范圍的相關(guān)性,使用Akaike信息準(zhǔn)則對交互信息進(jìn)行評價,并選擇高識別性能特征,提高人體朝向的精度和速度.實(shí)驗(yàn)結(jié)果表明,本文方法的人體朝向識別準(zhǔn)確率可以到達(dá)90%左右.
圖4 不同方法的朝向標(biāo)簽識別結(jié)果