国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于極大似然目標(biāo)狀態(tài)估計的傳感器管理

2016-11-17 10:26熊朝華王建宏
計算機(jī)測量與控制 2016年3期
關(guān)鍵詞:協(xié)方差陀螺矩陣

吳 蔚,熊朝華, 許 鶯,王建宏

(信息系統(tǒng)工程重點實驗室,南京 210007)

?

基于極大似然目標(biāo)狀態(tài)估計的傳感器管理

吳 蔚,熊朝華, 許 鶯,王建宏

(信息系統(tǒng)工程重點實驗室,南京 210007)

為估計目標(biāo)運動的狀態(tài)估計量,設(shè)計相應(yīng)的傳感器管理方案,文章依據(jù)貝葉斯概率知識,采用極大似然的最優(yōu)化方法來估計目標(biāo)運動的狀態(tài)估計值;依據(jù)目標(biāo)狀態(tài)估計的誤差協(xié)方差矩陣與其Fisher信息矩陣間的聯(lián)系,推導(dǎo)似然函數(shù)關(guān)于目標(biāo)狀態(tài)各個分量的偏導(dǎo)數(shù);采用隨機(jī)離散時間系統(tǒng)知識,推導(dǎo)出對角式Fisher信息矩陣所有對角線上的各個元素;以Fisher信息矩陣的跡范數(shù)作為傳感器管理中的最優(yōu)代價函數(shù),采用0-1整數(shù)規(guī)劃算法來求解傳感器的分配矩陣;最后將極大似然的目標(biāo)狀態(tài)估計及其相應(yīng)的傳感器管理方案應(yīng)用于無人直升機(jī)的飛行控制系統(tǒng)中,以驗證本文方法的有效性。

目標(biāo)狀態(tài)估計;極大似然;協(xié)方差矩陣;傳感器管理

0 引言

目標(biāo)跟蹤的目的是利用傳感器的觀測數(shù)據(jù)來估計目標(biāo)的運動參數(shù),包括目標(biāo)的位置和速度等信息。目標(biāo)跟蹤可定義為已知目標(biāo)的某些先驗概率信息,在視頻觀測序列中連續(xù)獲取目標(biāo)運動信息(如位置、速度和尺寸等)的過程。這些運動信息即可作為目標(biāo)運動過程中的狀態(tài)變量。對目標(biāo)運動狀態(tài)的估計,可用于對所感興趣的目標(biāo)進(jìn)行檢測,精確捕獲目標(biāo)之后將其轉(zhuǎn)化為自動跟蹤模式,便于對目標(biāo)屬性進(jìn)行評估、分類和識別;目標(biāo)狀態(tài)的估計仍可應(yīng)用于下步的飛行控制器設(shè)計過程中。在目標(biāo)跟蹤、目標(biāo)狀態(tài)估計、目標(biāo)定位檢測過程都需要利用到傳感器所采集到的各種觀測信息,而傳感器的布局設(shè)計與傳感器系統(tǒng)的資源都是有限的,在通信數(shù)據(jù)鏈的通信帶寬和傳輸能量等方面也常常受到眾多因素的限制。因此傳感器的布局管理技術(shù)是目標(biāo)跟蹤性能的首要基礎(chǔ)問題。

目標(biāo)跟蹤是強(qiáng)調(diào)對目標(biāo)狀態(tài)的融合估計與預(yù)測對被跟蹤目標(biāo)進(jìn)行在線建模,獲得準(zhǔn)確的當(dāng)前目標(biāo)狀態(tài),并對未來一段時域內(nèi)目標(biāo)狀態(tài)進(jìn)行預(yù)測。對目標(biāo)狀態(tài)的融合估計已研究得非常透徹,已提出較多的融合估計方法。如對線性系統(tǒng)的卡爾曼濾波法;對非線性系統(tǒng)的無色卡爾曼濾波法;可同時適用于線性或非線性系統(tǒng)的粒子濾波法等。因傳感器管理是服務(wù)于下步的目標(biāo)跟蹤、目標(biāo)狀態(tài)估計以及飛行控制系統(tǒng)設(shè)計,所以傳感器管理設(shè)計方案的優(yōu)劣可通過其服務(wù)最終目的來體現(xiàn)?;诖怂枷?,可從目標(biāo)狀態(tài)估計的準(zhǔn)確度方面來設(shè)計傳感器方案。對于所建立的目標(biāo)運動方程,采用卡爾曼濾波算法得到目標(biāo)運動時的狀態(tài)估計及其相應(yīng)的協(xié)方差矩陣。構(gòu)造關(guān)于協(xié)方差矩陣的某個矩陣范數(shù),通過此范數(shù)的最小化來得到最優(yōu)的傳感器設(shè)計方案。

基于最小化方差矩陣某范數(shù)的設(shè)計原則,文獻(xiàn)[1]研究基于Riccati方程與Kuhn-Munkres算法相結(jié)合的傳感器跟蹤資源分配;文獻(xiàn)[2]從流形中的Fisher信息距離之間的區(qū)分度來制定傳感器資源分配策略;文獻(xiàn)[3]利用粒子濾波器逼近目標(biāo)狀態(tài),并估計協(xié)方差矩陣,實現(xiàn)傳感器節(jié)點在線選擇;文獻(xiàn)[4]根據(jù)濾波后的目標(biāo)誤差協(xié)方差與不同戰(zhàn)場態(tài)勢下的期望之間的差異,利用模糊物元分析法控制傳感器實現(xiàn)對目標(biāo)的探測。文獻(xiàn)[5]針對傳感器管理設(shè)計中出現(xiàn)的最優(yōu)化問題采用經(jīng)典運籌學(xué)中的快速梯度算法來秋季,并分析此算法的迭代收斂性。文獻(xiàn)[6]推導(dǎo)在某些工業(yè)閉環(huán)控制系統(tǒng)中,如何構(gòu)造雙閉環(huán)控制器可調(diào)參數(shù)辨識的方差矩陣。此方差矩陣的推導(dǎo)過程可應(yīng)用于更為廣泛的飛行控制系統(tǒng)中。

本文依然是采用基于目標(biāo)狀態(tài)估計的精度來設(shè)計傳感器的管理方案。因目前已有的所有文獻(xiàn)都是采用卡爾曼濾波算法來估計目標(biāo)狀態(tài),僅僅簡單地給出協(xié)方差矩陣的定義表達(dá)式。其中的各個目標(biāo)狀態(tài)和協(xié)方差矩陣也只是由其遞推形式隱含地給出,而沒有一個顯式的表達(dá)式。本文繞開卡爾曼濾波算法的目標(biāo)狀態(tài)估計,構(gòu)造極大似然的后驗概率密度似然函數(shù),通過最大化關(guān)于后驗概率密度的似然函數(shù)來得到目標(biāo)狀態(tài)的一個顯式解析解,且最優(yōu)解可通過較為簡單的一階次快速梯度算法來求解。利用誤差協(xié)方差矩陣的克拉美—勞下界公式,詳細(xì)推導(dǎo)似然函數(shù)關(guān)于目標(biāo)狀態(tài)的一階偏導(dǎo)數(shù)運算;通過復(fù)雜的矩陣運算過程得到Fisher信息矩陣的對角形式;依據(jù)協(xié)方差矩陣與Fisher信息矩陣間的緊密聯(lián)系,構(gòu)造傳感器管理設(shè)計方案的最優(yōu)化問題。

1 非線性狀態(tài)空間的狀態(tài)估計

以下首先給出本文提出的目標(biāo)狀態(tài)估計的極大似然法,以此狀態(tài)估計值作為第3節(jié)傳感器管理中的基礎(chǔ)。因目標(biāo)運動的動態(tài)系統(tǒng)可建模成含有隱性狀態(tài)的狀態(tài)空間模型,其隱性狀態(tài)的部分信息可通過觀測量來獲取。狀態(tài)變量可能含有移動目標(biāo)平臺的位置、速度和加速度等物理量,觀測量可采用慣性陀螺等傳感器來測取??紤]目標(biāo)運動時的離散時間非線性隨機(jī)系統(tǒng)為:

(1)

(2)

其中有:

∝p(y1:t|x1:t)P(x1:t)

(2)式中p(x1:t|y1:t)表示后驗概率密度函數(shù),p(y1:t|x1:t)表示似然,p(x1:t)表示先驗概率密度。當(dāng)觀測量y1:t已知時,p(y1:t)也應(yīng)是一個已知量。∝表示除去那些常數(shù)量后剩下的概率密度形式。

因觀測方程中的觀測噪聲et為獨立同分布的白噪聲,即有:

似然p(yi|xi)為:

p(yi|xi)=pei(yi-h(xi))

利用全概率公式可得:

(3)

由馬爾科夫性質(zhì)可得:

(4)

重復(fù)應(yīng)用(3)式和(4)式可得:

其中p(x1)表示在時刻t=1處初始狀態(tài)的先驗概率信息,由狀態(tài)方程可知:

p(xi|xi-1)=pwi-1(xi-f(xi-1))

應(yīng)用以上所定義的各個概率公式,可得(2)式中后驗概率密度為:

(5)

從而(2)式所示的目標(biāo)狀態(tài)估計值為:

(6)

將wt和et的獨立同分布高斯白噪聲的假設(shè)條件應(yīng)用于(6)式,可將3個概率密度函數(shù)展開,從而構(gòu)成一個非線性的最小二乘問題,利用文獻(xiàn)[5]中的一階快速梯度算法求解(6)式,可得到極大似然意義下的最優(yōu)目標(biāo)狀態(tài)估計值。

2 線性狀態(tài)空間的狀態(tài)估計

當(dāng)(1)式中的f(xt)和h(xt)分別為線性函數(shù)特例時,可得到線性高斯型的狀態(tài)空間模型。

其中的過程噪聲wt和觀測噪聲et分別滿足:

(7)

(7)式的含義表明:

(8)

將(8)式代入至(6)式中,并取負(fù)對數(shù)運算可得:

(2)

(10)

對(10)式所示的一階偏導(dǎo)運算展開,可得t個等式。從這t個等式中可求解出最優(yōu)餓目標(biāo)狀態(tài)估計值。由第2節(jié)和第3節(jié)的理論推導(dǎo)可知,目標(biāo)狀態(tài)估計的極大似然法是通過極大化似然函數(shù)的最優(yōu)化過程而得,這是其與卡爾曼濾波算法的區(qū)別之處。當(dāng)所構(gòu)造出來的似然函數(shù)為凸函數(shù)時,由一階快速梯度算法得到的最優(yōu)解必是全局最優(yōu)解,也即為目標(biāo)狀態(tài)的無偏估計。另外極大似然目標(biāo)狀態(tài)估計法還可用于關(guān)于目標(biāo)狀態(tài)的約束估計。即當(dāng)假設(shè)概率密度函數(shù)px1(x1),pwi(wi),pe1(ei)為已知的對數(shù)形式時,約束的目標(biāo)狀態(tài)估計的最優(yōu)化問題為:

(11)

3 傳感器設(shè)計

3.1 協(xié)方差矩陣的計算

因傳感器的管理設(shè)計方案是體現(xiàn)目標(biāo)狀態(tài)估計的精度,而狀態(tài)估計的精度卻是由估計的誤差協(xié)方差矩陣來體現(xiàn)。為此本節(jié)首先分析極大似然目標(biāo)狀態(tài)估計的誤差協(xié)方差矩陣形式。 由文獻(xiàn)[6]可知,在(9)式中若利用泰勒級數(shù)展開,會使得協(xié)方差矩陣的計算過程異常復(fù)雜。因為需要計算(9)式似然函數(shù)的一階和二階偏導(dǎo)矩陣。但為減少算法的復(fù)雜度,可直接利用Fisher信息矩陣來構(gòu)造目標(biāo)狀態(tài)估計的克拉美—勞下界,即:

(12)

由(12)式可見,在Fisher信息矩陣的計算過程中需要計算出如下的各個一階偏導(dǎo)運算。

(13)

列出極大似然函數(shù)關(guān)于各個目標(biāo)狀態(tài)的一階偏導(dǎo)矩陣為:

(14)

將(14)式代入至(2)式的Fisher信息矩陣的計算過程中,并在取數(shù)學(xué)期望運算時,利用過程噪聲和觀測噪聲間的獨立同分布性,可得到一個對角形式的Fisher信息矩陣。

(15)

利用對角矩陣的求逆運算,可到協(xié)方差矩陣的克拉美—勞下界為:

3.2 傳感器管理的最優(yōu)化

因在傳感器的管理設(shè)計過程中,常設(shè)有m個目標(biāo),n個傳感器。當(dāng)考慮目標(biāo)i對傳感器j的目標(biāo)狀態(tài)估計的協(xié)方差矩陣時,以上的各個變量需要作對應(yīng)的修改,用以強(qiáng)調(diào)是目標(biāo)i對傳感器j的協(xié)方差矩陣。此時可對應(yīng)地表示為:

目標(biāo)i對應(yīng)的變量有:Ai, Ci

即目標(biāo)i對傳感器j的目標(biāo)狀態(tài)估計的協(xié)方差矩陣Pij為:

(16)

由文獻(xiàn)[1]中的定義可知,目標(biāo)i的優(yōu)先級函數(shù)為pi,且pi∈[0,1],當(dāng)有命令指示作用于目標(biāo)i時取pi=1,否則取pi=0。由傳感器j對目標(biāo)i執(zhí)行任務(wù)時的價值函數(shù)Vij取為:

(17)

(17)式右邊的各個量都是已知的,從而可簡單地確定出價值函數(shù)Vij。定義目標(biāo)—傳感器分配矩陣為X,其元素為xij,當(dāng)目標(biāo)i與傳感器j配對成功時取xij=1,否則取xij=0。為此將傳感器的管理設(shè)計問題描述為一個最優(yōu)化的傳感器管理分配模型為:

(18)

(18)式中的兩個約束條件分別保證每個傳感器只能作用于一個目標(biāo)和每個目標(biāo)至少被一個傳感器所執(zhí)行任務(wù)。因(18)式中的最優(yōu)化變量xij只能在0-1中取值,即(18)式為一個0-1整數(shù)規(guī)劃問題[7]。關(guān)于(18)式的最優(yōu)化求解可直接采用運籌學(xué)數(shù)學(xué)優(yōu)化中的分枝有界算法。

4 仿真算例

將極大似然的目標(biāo)狀態(tài)估計及其相應(yīng)的傳感器管理方案應(yīng)用于無人直升機(jī)的飛行控制系統(tǒng)中。無人直升機(jī)在空中飛行時呈現(xiàn)出六自由度的飛行姿態(tài),包括仰俯、滾轉(zhuǎn)和偏航3種飛行姿態(tài)。安裝在無人直升機(jī)機(jī)身上的傳感器為垂直陀螺,垂直陀螺為無人直升機(jī)飛行控制系統(tǒng)提供姿態(tài)角相關(guān)信息。垂直陀螺采用縱向安裝方式,其結(jié)構(gòu)示意圖如圖1所示。將陀螺的外環(huán)軸平行于無人直升機(jī)的縱軸,轉(zhuǎn)子軸與地垂線重合,方向向上地安裝[8]。

圖1 垂直陀螺儀結(jié)構(gòu)示意圖

由垂直陀螺采集無人直升機(jī)在每次飛行過程中的各種觀測信息,將采集信息通過數(shù)據(jù)通信鏈發(fā)送給測控站。在仿真中設(shè)定無人直升機(jī)的航跡:首先垂直定高5米,然后以5米/秒的上升速度垂直定高至100米,高度保持以40米/秒的前飛速度直飛,在100秒無人直升機(jī)以5米/秒的垂向速度下降,40米/秒的前飛速度下滑至50米高度繼續(xù)前飛,仿真至300秒結(jié)束。仿真建模時,垂直陀螺針對于無人直升機(jī)的狀態(tài)方程為:

xt+1=Axt+wt,yt=Cxt+et

(19)

對(19)式的無人直升機(jī)運動方程應(yīng)用基于最優(yōu)化的極大似然目標(biāo)狀態(tài)估計策略,考慮垂直陀螺中也存在著白觀測噪聲,特別考慮無人直升機(jī)飛行狀態(tài)的俯仰角變化,無人直升機(jī)模型輸出的俯仰角、垂直陀螺仿真模型輸出的俯仰角、濾波后俯仰角的最優(yōu)估計如圖2所示。

圖2 俯仰角間的對比

圖2中分別給出無人直升機(jī)的實際俯仰角、垂直陀螺的仿真俯仰角及其對應(yīng)的比較圖形。即圖2(a)表示(19)式的期望目標(biāo)狀態(tài),圖2(b)表示由極大似然法得到的目標(biāo)狀態(tài)估計值,圖2(c)表示期望值和估計值間的差異。

再次觀測(19)式矩陣A的維數(shù)為6,狀態(tài)的維數(shù)為6,可將其依次作為6個目標(biāo),即i=6。根據(jù)傳感器管理最優(yōu)化問題中的兩個約束條件可知,垂直陀螺的個數(shù)不得少于6個,在仿真過程中可取j=6。在6個狀態(tài)分量的目標(biāo)中,選擇目標(biāo)優(yōu)先級排序為:

T4≥T5≥T6≥T1≥T2≥T3

(20)

仿真過程中可安置6個垂直陀螺,關(guān)于垂直陀螺的內(nèi)部結(jié)構(gòu)、某些物理參數(shù)和各目標(biāo)的價值函數(shù)等可參考文獻(xiàn)[9] [10]。根據(jù)協(xié)方差矩陣的垂直陀螺最優(yōu)化設(shè)計,各目標(biāo)狀態(tài)與各陀螺間的一一對應(yīng)匹配見如圖3所示。

圖3 垂直陀螺的分配圖

5 結(jié)語

避開經(jīng)典卡爾曼濾波目標(biāo)狀態(tài)估計需要大量的統(tǒng)計概率知識,采用極大似然函數(shù)得到目標(biāo)狀態(tài)估計的后驗概率估計值,充分利用最優(yōu)化的快速梯度算法。以極大似然目標(biāo)狀態(tài)估計值為基礎(chǔ),詳細(xì)推導(dǎo)出誤差協(xié)方差矩陣的克拉美—勞下界的Fisher信息矩陣式。以此Fisher信息矩陣的跡運算作為傳感器管理分配的模型之中。因為傳感器管理對應(yīng)的是一個帶有約束條件的0-1整數(shù)規(guī)劃問題,對此最優(yōu)化問題的求解還有待于更深層次的算法分析。

[1] 童 俊,單甘霖.基于修正Riccati方程與Kuhn-Munkres算法的多傳感器跟蹤資源分配[J]. 控制與決策, 2012, 27(5): 747-751.

[2] 張華睿,楊宏文.基于Fisher信息距離的傳感器管理方法[J]. 系統(tǒng)工程與電子技術(shù), 2012, 34(8): 1587-1591.

[3] 楊小君,馬 祥.基于條件后驗克拉美—勞下界的目標(biāo)跟蹤傳感器管理[J]. 控制理論與應(yīng)用, 2013, 30(5): 543-548.

[4] 崔博鑫,計蘊山.基于任務(wù)控制的動態(tài)多傳感器管理方案[J]. 系統(tǒng)工程與電子技術(shù), 2012, 34(2): 2473-2478.

[5] 王建宏.故障估計下子空間預(yù)測控制的快速梯度算法[J]. 上海交通大學(xué)學(xué)報自然科學(xué)版, 2013, 47(7): 1015-1021.

[6] 王建宏,許 鶯.虛擬參考反饋校正控制的統(tǒng)計漸近性分析[J]. 計算機(jī)應(yīng)用研究, 2015, 32(4): 1069-1073.

[7] Jacob Roll. Identification of piecewise affine systems via direct mixed integer programming[J]. Automatica, 2004, 40(1): 37-50.

[8] Fagiano L. Optimization of airbome wind energy generators[J]. International Journal of Robust and Nonlinear Control, 2012, 22(8): 2055-2083.

[9] 吳森堂,費玉華.飛行控制系統(tǒng)[M].北京:北京航空航天大學(xué)出版社,2005.

[10] 王惠南.GPS導(dǎo)航原理與應(yīng)用[M].北京:科學(xué)出版社,2003.

Sensor Management Under Maximum Likelihood Target State Estimation

Wu Wei, Xiong Zhaohua, Xu Ying, Wang Jianhong

(Key Lab.of Information Systems Engineering, Nanjing 210007, China)

To estimate the state estimation about the considered target, and devise the corresponding sensor management, this paper uses Bayesian probability knowledge and maximum likelihood optimum method to estimate the target state estimation. This maximum likelihood method can not only solve the explicit solution of the target state with optimum strategy, but also deal with many constraints about the measurement and state variables. With the closed connection between the error covariance matrix and its Fisher information matrix, we derive the differentiation of the likelihood function with respect to each variable. Using some knowledge from stochastic discrete time system, we give every element which lies in the diagonal line of the diagonalized Fisher information matrix. The trace operation of the Fisher information matrix is applied to be the optimal cost function in the sensor management and then one 0-1 mixed integer numerical programming is used to obtain the sensor distribution matrix. Finally, we apply the sensor management under maximum likelihood target state estimation strategy into the flight control system of UAV in order to confirm the efficiency of the proposed strategy.

target state estimation; maximum likelihood; covariance matrix; sensor management

2015-08-17;

2015-11-11。

吳 蔚(1980-),女,福建漳州人,主要從事信息融合與資源管理方向的研究。

熊朝華(1963-),男,陜西西安人,研究員,主要從事信息融合方向的研究。

1671-4598(2016)03-0139-04

10.16526/j.cnki.11-4762/tp.2016.03.038

TP273

A

猜你喜歡
協(xié)方差陀螺矩陣
做個紙陀螺
玩陀螺
陀螺轉(zhuǎn)轉(zhuǎn)轉(zhuǎn)
我最喜歡的陀螺
用于檢驗散斑協(xié)方差矩陣估計性能的白化度評價方法
多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
二維隨機(jī)變量邊緣分布函數(shù)的教學(xué)探索
初等行變換與初等列變換并用求逆矩陣
不確定系統(tǒng)改進(jìn)的魯棒協(xié)方差交叉融合穩(wěn)態(tài)Kalman預(yù)報器
矩陣
巴彦淖尔市| 长寿区| 吴江市| 西贡区| 泸定县| 久治县| 准格尔旗| 富民县| 怀来县| 乳山市| 个旧市| 太白县| 西青区| 包头市| 汤原县| 棋牌| 措勤县| 汕尾市| 桐庐县| 广平县| 洛隆县| 舞阳县| 扬中市| 泽库县| 沂南县| 沈阳市| 新化县| 左云县| 民县| 噶尔县| 唐山市| 西丰县| 自贡市| 绥棱县| 韶关市| 隆德县| 白朗县| 富宁县| 潜山县| 乐亭县| 延川县|