老建偉 張國良
摘 要:為了解決“基于卡爾曼濾波的神經網絡算法”由于目標模型不確定性而出現(xiàn)的預測信息不準確,甚至發(fā)散的問題以及由于傳感器誤差而造成的估計誤差偏大導致跟蹤失效的問題,提出將強跟蹤濾波(STF)應用于人工神經網絡算法中,以神經網絡中各層連接權值構成STF濾波的狀態(tài)向量,引入時變漸消因子,強迫殘差具有正交性或近似正交性,以克服上述問題。實驗仿真證明,改進后的算法提高了網絡訓練速度、濾波精度、數值穩(wěn)定性以及對目標的跟蹤性能。
關鍵詞:數據融合;神經網絡;卡爾曼濾波;強跟蹤濾波
中圖分類號:TP183文獻標識碼:B
文章編號:1004 373X(2009)02 059 04
Neural Network Algorithm Based on STF Filter
LAO Jianwei,ZHANG Guoliang
(Second Institute of Artillery Engineering,Xi′an,710025,China)
Abstract: Algorithm for feedforward neural network based on Kalman filter has some problems,the prediction information is inaccurate,even emanative because of the target model′s inaccuracy,and the larger estimate error makes tracking-disable because of sensors′ error.Aiming at these shortcomings,a learning algorithm based on Strong Tracking Filtering (STF) filter is proposed for training a neural network,it regards all the weight values as the states.The fading factor is introduced,and residuals are forced to have orthogonality or approximately orthogonality to solve these problems.Simulation results show that the new algorithm improves rapidity of network′s convergence,data′s accuracy,stability and target tracking performance.
Keywords:data fusion;neural network;Kalman filter;STF filter
0 引 言
移動機器人是機器人學領域中的一個重要研究分支,它是一個集環(huán)境感知、動態(tài)決策與規(guī)劃、行為控制與執(zhí)行等多種功能于一體的綜合系統(tǒng)。移動智能機器人通過傳感器感知環(huán)境和自身狀態(tài),而傳感器受本身精度以及外界環(huán)境干擾等限制,所提供給上層決策系統(tǒng)的數據的可靠性十分有限,不足以滿足控制系統(tǒng)的要求。移動機器人多傳感器信息融合濾波技術彌補了傳感器數據采集所固有的缺陷,現(xiàn)已成為移動機器人智能化研究領域的關鍵技術[1,2]。
針對不同應用問題,提出了多種數據融合算法,如加權平均法,貝葉斯方法、Dempster-Shafer證據推理理論(D-S證據理論)、模糊集理論、估計理論、卡爾曼濾波、概率統(tǒng)計決策理論和神經網絡等。
文獻[3]提出根據各傳感器噪聲方差,對各傳感器實時測量值進行最優(yōu)加權融合的濾波方法。該算法復雜度低,但濾波效果不是很明顯。文獻[4]提出的應用誤差反向傳播算法在實際應用中收斂速度慢,容易陷入局部最小等問題。文獻[5]提出應用離散卡爾曼濾波對數據進行融合處理,但是,由于足球機器人系統(tǒng)是一個復雜、時變的非線性系統(tǒng),傳感器的輸出信息沒有規(guī)律性,所以突變狀態(tài)的預測能力顯得尤為重要,并且卡爾曼最優(yōu)預測估計對目標運動模型依賴很大,當系統(tǒng)的建模與所研究的真實系統(tǒng)不相匹配時,會出現(xiàn)預測信息不準確,甚至發(fā)散等現(xiàn)象。
這里根據神經網絡理論及強跟蹤濾波器(STF)的特點,將STF濾波應用于神經網絡方法中,提出基于STF濾波的神經網絡算法對位置信息進行濾波和預測,改進的算法提高了濾波精度和數值穩(wěn)定性,同時也提高了網絡訓練速度,以及對目標的跟蹤性能。
1 基于STF濾波的神經網絡算法
1.1 實驗平臺
該文實驗平臺為第二炮兵工程學院獨立設計并研發(fā)制造的“東風Ⅱ代”足球機器人,如圖1所示。
足球機器人比賽是近年來國際上興起的一種高科技活動。其集機器人學、智能控制、數據融合、計算機技術、無線通信、圖像處理、機械學等多種學科于一體,為控制理論提供了一個比較好的實驗平臺。
1.2 基于自適應卡爾曼濾波的神經網絡算法
傳統(tǒng)的神經網絡存在收斂速度慢,容易陷入局部最小,數據穩(wěn)定性差等問題。文獻[6]提出將自適應卡爾曼濾波應用于神經網絡。得到基于自適應卡爾曼濾波的神經網絡算法,其中:
狀態(tài)方程:
(k+1)=(k+1|k)+K(k+1)·
{Y璭(k)-h(k),Y璻(k)〗}(1)
狀態(tài)一步預測方程:
(k+1|k)=(k|k)(2)
增益方程:
K(k+1)=P(k+1|k)hT(k+1)·
-1(3)
誤差協(xié)方差一步預測方程:
P(k+1|k)=P(k|k)(4)
誤差協(xié)方差更新方程:
P(k+1)=P(k+1|k)(5)
圖1 “東風Ⅱ代”足球機器人
1.3 基于STF濾波的神經網絡算法
卡爾曼最優(yōu)預測估計對目標運動模型依賴很大,當系統(tǒng)的建模和所研究的真實系統(tǒng)不相匹配時,會出現(xiàn)預測信息不準,甚至發(fā)散等現(xiàn)象。應用于神經網絡的卡爾曼濾波算法在公式推算時進行了泰勒展開,忽略高階項的數學方法,因此,其狀態(tài)方程的準確性在工程實踐中很可能帶來不確定的影響。
STF是一種非線性自適應濾波器,它可以用于一大類非線性系統(tǒng)的狀態(tài)估計和狀態(tài)與參數的聯(lián)合估計。STF使用正交性原理,引入時變漸消因子,強迫殘差具有正交性或近似正交性;這樣目標模型不確定性對狀態(tài)估計造成的影響就可以得到解決,同時通過實時調節(jié)增益,促使測量殘差近似正交,克服由于傳感器誤差而造成的估計誤差偏大導致跟蹤失效的現(xiàn)象,從而提高了對目標的跟蹤性能。
STF采用在線選擇適當的時變增益K(k+1),使:
E{(k+1|k+1)〗·
(k+1|k+1)〗T}=min(6)
E=0,
k=1,2,…,i=1,2,…(7)
式(6)是卡爾曼濾波的性能指標;式(7)要求不同時刻的殘差序列處處保持正交。已經證明,當模型與實際系統(tǒng)完全匹配時,卡爾曼濾波的輸出殘差序列是不自相關的高斯白噪聲序列,式(7)滿足這一要求,因而其不減弱卡爾曼濾波的性能。但在實際問題中,選擇的模型不可避免地存在不確定性,因此卡爾曼濾波的輸出殘差不可能白化。建立在性能指標式(6)和式(7)基礎上的STF,引進漸消因子λ(k+1),實時調節(jié)增益K(k+1),強迫輸出殘差近似為高斯白噪聲,最大程度地提取輸出殘差中一切有效信息。漸消因子由下式計算:
λ(k+1)=λ0,λ0≥1
1,λ0<1(8)
式中,λ0=tr r;tr為矩陣的跡(對角線元素之和)。其中:
N(k+1)=S(k+1)-η R(k+1)(9)
M(k+1)=P(k|k)hT(k+1)h(k+1)(10)
S(k+1)=γ(1)γT(1),k=0
ρS(k)+γ(k+1)γT(k+1)1+ρ,k≥1(11)
γ(k+1)=Y璭(k+1)-h(k+1)(k+1|k)(12)
式中,0≤ρ≤1為遺忘因子,一般取ρ=0.95。弱化次優(yōu)因子η≤1是為了使狀態(tài)估計值更加平滑,可憑經驗選定。
應用于傳感器信息濾波的STF神經網絡算法只需調整卡爾曼濾波基本方程(4)為:
P(k+1|k)=λ(k+1)P(k)(13)
結合式(8)~式(12)、式(1)~式(3)、式(5)、式(13)便構成基于STF濾波的神經網絡算法。
W(k+1|k)=W(k|k)(14)
W(k+1)=W(k+1|k)+K(k+1)·
{Y璭(k+1)-h}(15)
K(k+1)=P(k+1|k)hT(k+1)·
{h(k+1)P(k+1|k)hT(K+1)+P(k+1)〗-1(16)
P(k+1|k)=λ(k+1)P(k)(17)
P(k+1)=·P(k+1|k)(18)
基于離散系統(tǒng)的卡爾曼最優(yōu)預測估計,其借鑒STF解決問題的方法,在卡爾曼最優(yōu)預測估計過程中引進漸消因子,促使測量殘差近似正交,最大程度地提取測量殘差中一切有效信息。
基于STF的預測估計算法如下:
首先,計算最優(yōu)增益矩陣:
K(k)=P(k|k-1)hT hT+R(k)〗-1(19)
由此得到狀態(tài)的最優(yōu)預測估計值:
(k+1|k)=(k|k-1)+K(k)·
(k|k-1)〗(20)
引入漸消因子,調整估計誤差方差陣:
P(k+1|k)=λ(k+1)P(k|k-1)-λ(k+1)
K(k)h(k)P(k|k-1)(21)
將STF理論應用于最優(yōu)預測估計,克服了一般預測方法對目標運動模型的依賴性,并對目標的突變狀態(tài)增強適應性,提高對目標的跟蹤控制性能。通過對前一時刻觀測值的測量,可以得到運動目標的狀態(tài)預測,便于實現(xiàn)對目標的準確跟蹤。
2 實驗與分析
2.1 網絡初始化
首先構建神經網絡,然后設置網絡層數、各層節(jié)點數、各層作用函數、各層初始權值矩陣、評價函數goal、最大循環(huán)次數epoch、學習速率η和動量a。
在“東風Ⅱ代”機器人傳感神經網絡中,傳感器信息輸入源包括:
(1) 視覺系統(tǒng)傳感器,圖像采集處理輸出的足球橫坐標,以及根據采樣頻率計算得到的足球速度、加速度信號3組;
(2) 機器人自定位信息3組,神經網絡輸入層有6組輸入信息源。
考慮根據機器人與足球的不同狀態(tài),采集機器人靜止、方位角0°、足球橫向運動狀態(tài)為實驗狀態(tài),采集400組“東風Ⅱ代”運動過程中傳感器輸出值作為訓練樣本,機器人定位信息皆為0;足球定位采樣如圖2所示。
隱層神經元作用函數采用tansig函數,如圖3所示。根據訓練效果和經驗值,隱含層神經元設計為4組,初始權值為(-1,1)之間的隨機數。輸出層神經元激活函數為線性函數purelin,如圖4所示。學習步長取為0.1,目標誤差取為0.000 1。
2.2 濾波訓練過程
該算法的實質是將問題轉化為狀態(tài)參數估計的問題,在輪訓練過程中,網絡的權值與閾值作為濾波器的狀態(tài),而網絡的輸出作為濾波器的觀測,即將神經網絡中各層連接權值構成卡爾曼濾波的狀態(tài)向量;網絡輸出作為濾波器的觀測,其系統(tǒng)狀態(tài)方程和觀測方程分別為:
W(k+1|k)=W(k|k)+ΔW
Y璭(k)=h[W(k),X(k),k]+V(k)=Y璻(k)+V(k)
式中,ΔW為狀態(tài)更新量;Y璭(k)為期望輸出;X(k)為輸入向量;Y璻(k)為實際輸出;V(k)為高斯白噪聲,其統(tǒng)計特性為E=0,E=R(k);h(·)為輸入/輸出及權值、閾值間的非線性映射關系。
圖2 部分傳感器輸出采樣值
圖3 tansig函數
圖4 purelin函數
隱含層各神經元輸入為:
I璱=∑nj=1w1璱jx璲,i=1,2,3,4
w1璱j為輸入到隱含層連接權。
隱層神經元作用函數為tansig函數:
y=2/(1+e-2x)-1
則隱層輸出為:
o璱=y(I璱)
輸出層作用函數為線性函數:
y=x
則輸出層輸出為:
y璷=∑4i=1w2璱o璱,i=1,2,3,4
w2璱為輸入到隱含層連接權。
隱層作用函數求偏導得:
祔/祒=(1+y)(1-y)
輸出層作用函數求偏導得:
祔/祒=1
則觀測方程中的傳遞矩陣h為:
h=o璱,w為輸出層連接權
(1+o璱)(1-o璱)w2璱x璲,w為隱含層連接權
0,其他
圖5為普通神經網絡訓練曲線、基于卡爾曼濾波的神經網絡曲線與基于STF濾波的神經網絡訓練曲線的誤差變化對比。由圖可以看出普通神經網絡末段收斂速度緩慢,訓練迭代次數最多,基于STF濾波的神經網絡收斂速度快,輸出精度高。
圖5 訓練過程
為了比較濾波處理效果,分別應用卡爾曼濾波和STF神經網絡對狀態(tài)觀測值進行濾波預測處理。取圖像傳感器測量誤差的協(xié)方差矩陣R=0.005I,濾波相對誤差由下式求得:
d=|(k)-X(k)||X(k)|×100%
將STF神經網絡經過訓練后的權值作為最終連接權值,使用隨機產生50組檢驗樣本序列,其中部分數據加入突變用于對比濾波結果,如圖6所示。
3 結 語
實驗表明,STF神經網絡對多傳感器數據融合,補償傳感器誤差,改善傳感器性能是有效的。STF神經網絡對傳感器數據進行融合處理,輸出穩(wěn)定、迭代次數少、突變跟蹤能力強,是一種有效的數據處理工具。
圖6 兩種融合算法預測對比圖
參考文獻
[1]何友,王國宏.多傳感器信息融合及應用[M].北京:電子工業(yè)出版社,2000.
[2]王仲民,岳宏,劉繼巖.移動機器人多傳感器信息融合技術述評[J].傳感器技術,2005,24(4):5-7.
[3]劉勇,沈毅,胡恒章.精確制導武器及其支持系統(tǒng)中的信息融合技術[J].系統(tǒng)工程與電子技術,1999,21(4):1-11.
[4]游松,程衛(wèi)星,王田苗,等.基于任務的神經網絡多傳感器數據融合新方法[J].高技術通訊,2001,11(7):71-75,96.
[5]李群力,傅妍芳.基于Kalman濾波的數據融合研究[J].計算機仿真,2007,24(8):299-302.
[6]Scalem R S.Tepedelenliou N.A Fast Algorithm Training Feedforward Neural Networks.IEEE Trans.on Signal Processing,1992,40(1):202-210.
[7]Caldwell D G,Reddy K.Sensory Requirements and Performance Assessment of Telepresence Controller Robots.In:Proc.of IEEE Int.Conf.on Robotics & Auto.1996.
[8]張乃堯,閻平凡.神經網絡與模糊控制[M].北京:清華大學出版社,1998.
[9]宋海濤.全自主足球機器人決策與控制方法研究[D].西安:第二炮兵工程學院,2007.
[10]熊蓉,張翮,褚健,等.四輪全方位移動機器人的建模和最優(yōu)控制[J].控制與決策,2006,23(1):93-98.
[11]劉君華.智能傳感系統(tǒng)[M].西安:西安電子科技大學出版社,1999.
[12]栗素娟,王紀,閻保定,等.卡爾曼濾波在跟蹤運動目標上的應用.現(xiàn)代電子技術,2007,30(13):110-112.
作者簡介 老建偉 男,陜西西安人,在讀碩士研究生。主要研究方向為系統(tǒng)辨識、建模與精度控制。
張國良 陜西西安人,博士,副教授。主要研究方向為組合導航與機器人技術。