徐義文,張 力,慕曉冬,殷小靜
(第二炮兵工程學(xué)院 四系,陜西 西安710025)
部隊(duì)傳統(tǒng)的訓(xùn)練和演習(xí)方法不僅需要花費(fèi)巨額資金,而且要承擔(dān)人員傷亡的風(fēng)險(xiǎn),因此,傳統(tǒng)軍事訓(xùn)練難以對(duì)所有的假想情況進(jìn)行有效模擬[1]。近年來,虛擬人技術(shù)的出現(xiàn)為解決上述問題提供了新方法、新途徑,為進(jìn)一步增強(qiáng)軍事訓(xùn)練仿真的實(shí)效性開辟了新的道路。
虛擬士兵是士兵在虛擬戰(zhàn)場(chǎng)中的三維幾何特性與行為特性的表示,是軍事仿真的重要組成部分。虛擬士兵是虛擬人技術(shù)的一種典型應(yīng)用,良好的虛擬士兵模型可以大大增強(qiáng)系統(tǒng)的逼真性和沉浸感,甚至達(dá)到事半功倍的效果。如何在實(shí)時(shí)虛擬環(huán)境中創(chuàng)建具有真實(shí)感的智能行為與運(yùn)動(dòng)能力的自主虛擬人已成為計(jì)算機(jī)、虛擬現(xiàn)實(shí)及相關(guān)技術(shù)學(xué)科領(lǐng)域中一項(xiàng)富有挑戰(zhàn)性的研究工作[2]。鑒于軍事仿真領(lǐng)域的特殊性,虛擬士兵模型的真實(shí)度和可信度比其他類型的虛擬人要求更高,只有這樣才能達(dá)到令人滿意的效果。
目前針對(duì)虛擬士兵的研究可以歸結(jié)為兩方面:幾何建模和行為控制。對(duì)于前者,文獻(xiàn) [3]和文獻(xiàn) [4-5]分別運(yùn)用MDL模型和骨骼動(dòng)畫技術(shù)實(shí)現(xiàn)了對(duì)虛擬士兵基本動(dòng)作的仿真。對(duì)于后者,文獻(xiàn) [6]研究了虛擬士兵的失能模型,并提出了基于模糊規(guī)則的最佳攻擊目標(biāo)選擇算法,文獻(xiàn) [7]則針對(duì)如何提高虛擬士兵外觀的多樣化進(jìn)行了重點(diǎn)研究。
現(xiàn)有的虛擬士兵模型缺少對(duì)記憶和遺忘的研究,使得虛擬士兵難以表現(xiàn)出與人類相近的記憶和遺忘行為。如果虛擬士兵在復(fù)雜的虛擬戰(zhàn)場(chǎng)中不具有記憶能力,其感知獲得的信息無法及時(shí)保存,其他行為就難以繼續(xù);如果不具有遺忘能力,相反,總是 “過目不忘”,其行為的真實(shí)性也必然令人懷疑。總之,不具有記憶和遺忘能力的虛擬士兵是不完整的、缺少說服力的。因此,需要為虛擬士兵設(shè)計(jì)符合人類記憶和遺忘規(guī)律的記憶模型。
在虛擬智能體的研究中,一些學(xué)者進(jìn)行了相關(guān)研究,并取得了一定的成果。文獻(xiàn) [8]將記憶模型引入到人工魚的建模中,豐富了人工魚的認(rèn)知行為;文獻(xiàn) [9-10]在自主虛擬人的感知模型時(shí)構(gòu)建了基于環(huán)形隊(duì)列的記憶模型;文獻(xiàn) [11]構(gòu)建了虛擬自主汽車的真假記憶庫(kù)模型;文獻(xiàn)[12]則提出了基于鏈表的記憶模型。
上述記憶模型側(cè)重于在虛擬智能體內(nèi)部實(shí)現(xiàn)單純的信息存儲(chǔ)和刪除功能,是對(duì)記憶和遺忘的簡(jiǎn)單模擬。存在的主要問題是模型的結(jié)構(gòu)不夠完善,缺少對(duì)記憶信息之間的關(guān)聯(lián)關(guān)系和存儲(chǔ)結(jié)構(gòu)的研究,也沒有對(duì)記憶信息的遺忘和調(diào)用過程進(jìn)行探討。為此,本文從生物的記憶和遺忘原理出發(fā),在擴(kuò)展記憶系統(tǒng)模型的基礎(chǔ)上,提出了一個(gè)較為完整的智能記憶模型設(shè)計(jì)方案。
記憶的基本模型包括瞬時(shí)記憶、短時(shí)記憶、長(zhǎng)時(shí)記憶3種類型[13],如圖1所示。其中,瞬時(shí)記憶是感知信息的短時(shí)存儲(chǔ),在整個(gè)認(rèn)知過程中起到濾波器的作用;短時(shí)記憶由當(dāng)前頭腦中的信息組成,長(zhǎng)時(shí)記憶則存儲(chǔ)著主體關(guān)于世界的一切經(jīng)驗(yàn)和知識(shí)。
圖1 基本記憶模型
R.Atkinson[14]等在基本模型的基礎(chǔ)上進(jìn)行了擴(kuò)展,加入了對(duì)記憶過程進(jìn)行控制的記憶控制器,如圖2所示。
圖2 記憶系統(tǒng)擴(kuò)展模型
與記憶的保持相對(duì)應(yīng)的是,大腦具有天生的 “遺忘”機(jī)制。德國(guó)心理學(xué)家艾賓浩斯經(jīng)過長(zhǎng)期研究發(fā)現(xiàn)了人類遺忘的一般特性:
(1)遺忘在學(xué)習(xí)之后立即開始,并且每次學(xué)習(xí)所用去的時(shí)間與記憶衰減的時(shí)間間隔相比要小得多,為此,在學(xué)習(xí)期間自然衰減的作用可忽略不計(jì);
(2)遺忘的進(jìn)程不是均勻的,而是保持 “先快后慢”的原則;
(3)不同個(gè)體和記憶材料的遺忘曲線不同。
由于生物記憶與計(jì)算機(jī)系統(tǒng)的存儲(chǔ)形式相似,各種記憶形式能在計(jì)算機(jī)上獲得良好的實(shí)現(xiàn),這就使得記憶原理在計(jì)算機(jī)系統(tǒng)中的應(yīng)用成為可能[15]。從信息加工的角度看,記憶包括3個(gè)基本過程:信息進(jìn)入記憶系統(tǒng)-編碼,信息在記憶中存儲(chǔ)-保持,信息從記憶中提取出來-提取。
為了便于實(shí)現(xiàn)對(duì)記憶信息的編碼,首先需要對(duì)記憶信息進(jìn)行合理的分類。依據(jù)虛擬士兵記憶內(nèi)容的不同,本文將記憶信息分為五大類:實(shí)體信息、環(huán)景信息、路徑信息、任務(wù)信息、規(guī)則知識(shí)。
定義1 記憶強(qiáng)度M(memory degree)是描述虛擬士兵對(duì)信息的記憶程度的量,表示當(dāng)前能調(diào)用的記憶信息占完整信息的比重,M∈ [0,1]。由于瞬時(shí)記憶和短時(shí)記憶存儲(chǔ)時(shí)間都很短,在其作用期間,可以認(rèn)為它們的記憶強(qiáng)度保持不變,即假定兩種記憶在有效期內(nèi)有M=1。
定義2 記憶信息元MIC(memory info cell)是記憶系統(tǒng)中最小、最基本的信息單位,是各類記憶信息共有屬性的集合,其編碼形式為
MIC=<ID,Tc,S,Q,Content,M,tag,Rc,n>式中:ID——MIC的存儲(chǔ)編號(hào);Tc——?jiǎng)?chuàng)建時(shí)間,S={Entity,Scene,Path,Mission,Rule}——記憶信息的類型;Q= {instant,short,long}——MIC的存儲(chǔ)時(shí)間類型;Content——MIC包含的具體內(nèi)容,是MIC最重要的部分,不同的信息類型決定了Content的內(nèi)部結(jié)構(gòu);M——MIC的記憶強(qiáng)度;tag——標(biāo)志位,在不同的記憶存儲(chǔ)類型中,該標(biāo)志位具有不同的含義:對(duì)瞬時(shí)記憶 (Q=instant),tag為關(guān)注標(biāo)志位;對(duì)短時(shí)記憶 (Q=short),tag為激活標(biāo)志位;對(duì)長(zhǎng)時(shí)記憶 (Q=long),tag則為調(diào)用標(biāo)志位;Rc——MIC的記憶最大存儲(chǔ)容量,Content包含的信息量不能超過該值,否則超出的部分會(huì)進(jìn)入一個(gè)新建的MIC單元;n——MIC的激活或調(diào)用次數(shù)。
定義3 記憶信息包 (memory info package,MIP)是由若干個(gè)相同類型的MIC組成的集合,其編碼形式為
式中:ID——MIP的存儲(chǔ)編號(hào),Tp——MIP的創(chuàng)建時(shí)間,Rp——MIP的最大存儲(chǔ)容量,MICSet= {MIC1,MIC2,…,MICh}(Rp≥h≥0)為包含的MIC的集合。
定義4 記憶信息庫(kù) (memory info database,MID)是由若干個(gè)相互關(guān)聯(lián)的MIP組成的集合,其編碼形式為
式中:ID——MID的存儲(chǔ)編號(hào),Td——MID的創(chuàng)建時(shí)間,Rd——MID的最大存儲(chǔ)容量,MIPSet= {MIP1,MIP2,…,MIPn}(Rd≥n≥0)——包含的 MIP的集合。
由于瞬時(shí)記憶和短時(shí)記憶的存儲(chǔ)時(shí)間非常短,且信息的更新非常頻繁,因此對(duì)這兩種記憶信息采用槽式存儲(chǔ)結(jié)構(gòu),用時(shí)間控制器控制信息存入或退出槽道的順序,便于更新和訪問。槽式結(jié)構(gòu)如圖3所示。
圖3 槽式存儲(chǔ)結(jié)構(gòu)
相比之下,長(zhǎng)時(shí)記憶的存儲(chǔ)時(shí)間最長(zhǎng)。因?yàn)殚L(zhǎng)時(shí)記憶是記憶系統(tǒng)中記憶能力最強(qiáng)、記憶信息最多、結(jié)構(gòu)最復(fù)雜的記憶,且信息之間常常是相互關(guān)聯(lián)的。為此M.R.Quillian[14]等提出了長(zhǎng)時(shí)記憶的層次網(wǎng)絡(luò)模型,按照概念的級(jí)別建立信息的層次結(jié)構(gòu)。但是這種模型是靜態(tài)的,難以描述記憶信息的動(dòng)態(tài)變化過程。為此,借鑒層次網(wǎng)絡(luò)模型思想,本文采用廣義樹結(jié)構(gòu)存儲(chǔ)長(zhǎng)時(shí)記憶信息,既能構(gòu)建較為清晰的信息脈絡(luò),使信息之間的關(guān)聯(lián)關(guān)系層次分明,又便于實(shí)現(xiàn)信息的及時(shí)擴(kuò)充更新和其他操作。
存儲(chǔ)記憶信息的廣義樹就是廣義記憶樹(general memory tree,GMT),用GMT= {r,T1,T2,…,Tw}表示,其中r為根結(jié)點(diǎn),Ti為其中第i棵子樹,w≥0為子樹的個(gè)數(shù)。GMT的創(chuàng)建時(shí)間用根結(jié)點(diǎn)的創(chuàng)建時(shí)間來表示。樹中每個(gè)結(jié)點(diǎn)的度是任意的,這樣可以使得相互關(guān)聯(lián)的信息盡可能地保存在相近的位置。GMT的結(jié)構(gòu)如圖4所示。
圖4 GMT結(jié)構(gòu)
若干個(gè)GMT集合在一起便是廣義記憶森林 (general memory forest,GMF)。用符號(hào)可表示為:GMF={GMT1,GMT2,…,GMTm},其中 m≥0為 GMT的個(gè)數(shù)。GMT在GMF中按照其創(chuàng)建時(shí)間的先后進(jìn)行排列,便于后續(xù)對(duì)信息的快速搜索。GMF的結(jié)構(gòu)如圖5所示。
圖5 GMF結(jié)構(gòu)
記憶控制器的作用是建立記憶信息存儲(chǔ)時(shí)限的轉(zhuǎn)換規(guī)則,為模擬遺忘行為提供相應(yīng)的信息刪除算法,并為完成記憶信息的提取和調(diào)用提供較為簡(jiǎn)單、有效的實(shí)現(xiàn)算法,是智能記憶模型不可或缺的組成部分。
根據(jù)記憶原理可知,瞬時(shí)記憶存儲(chǔ)時(shí)間非常短,遺忘非???,只有少部分得到持續(xù)關(guān)注的瞬時(shí)記憶元才能轉(zhuǎn)換為短時(shí)記憶元;短時(shí)記憶元經(jīng)過多次學(xué)習(xí),達(dá)到一定閾值時(shí)則轉(zhuǎn)換為長(zhǎng)期記憶元;長(zhǎng)時(shí)記憶元若被記憶系統(tǒng)調(diào)用,該長(zhǎng)時(shí)記憶元?jiǎng)t被添加到為短時(shí)記憶中。給瞬時(shí)記憶元添加關(guān)注時(shí)間變量ta,當(dāng)其關(guān)注標(biāo)志位tag變?yōu)?時(shí),ta開始計(jì)時(shí)。記Ta為瞬時(shí)記憶關(guān)注時(shí)間閾值,Nk為短時(shí)記憶激活次數(shù)閾值,則存儲(chǔ)類型之間的轉(zhuǎn)換規(guī)則為:
對(duì)瞬時(shí)記憶和短時(shí)記憶而言,由于不具有明顯的遺忘過程,可以根據(jù)其作用的時(shí)間來判定是否將其遺忘。對(duì)瞬時(shí)記憶元,當(dāng)其關(guān)注標(biāo)志位tag為0時(shí),表明當(dāng)前未獲得關(guān)注,則刪除該記憶;對(duì)短時(shí)記憶元而言,當(dāng)其激活標(biāo)志位tag為0時(shí),表明當(dāng)前處于未被激活狀態(tài),該信息沒有被使用,則刪除該記憶。
長(zhǎng)時(shí)記憶存儲(chǔ)時(shí)間較長(zhǎng),遺忘過程比較緩慢,只有當(dāng)其記憶強(qiáng)度低于一定閾值時(shí),才能判定該記憶被遺忘。根據(jù)遺忘機(jī)理,構(gòu)建相應(yīng)的遺忘函數(shù)如下
式中:M1、M2——t1、t2時(shí)刻的記憶強(qiáng)度,α——與個(gè)體有關(guān)的個(gè)性衰減因子,β——與記憶信息類型有關(guān)的衰減系數(shù)。根據(jù)實(shí)際情況,該遺忘函數(shù)應(yīng)當(dāng)滿足條件
當(dāng)虛擬士兵對(duì)記憶信息進(jìn)行調(diào)用時(shí),該信息的記憶強(qiáng)度將會(huì)呈現(xiàn)階躍式增長(zhǎng)。為簡(jiǎn)化計(jì)算,分別記Mn、Mn+1為第n次和第n+1次調(diào)用時(shí)的記憶強(qiáng)度,對(duì)應(yīng)的時(shí)間分別為tn和tn+1,記Mt為t時(shí)刻的記憶強(qiáng)度,對(duì)tn≤t<tn+1有Mt的表達(dá)式為
令△M=μ(1-Mn),則△M表示經(jīng)過第n次調(diào)用后記憶強(qiáng)度的增量。其中 (1-Mn)為當(dāng)前最大的記憶強(qiáng)度增量,μ為強(qiáng)度激活系數(shù),且滿足μ∈ (0,1]。
在此基礎(chǔ)上,構(gòu)建長(zhǎng)時(shí)記憶的遺忘算法如下:
步驟1 初始化M0、βi(i=1,2,3,4,5)、α、μ;
步驟2 將記憶信息輸入GMT的對(duì)應(yīng)結(jié)點(diǎn),并構(gòu)造GMF;
步驟3 更新各葉子結(jié)點(diǎn)的M值,若tag=0,則按照式 (1)計(jì)算M;若tag=1,則按照式 (2)計(jì)算M;
步驟4 遍歷記憶樹的各個(gè)葉子結(jié)點(diǎn),若有M<Mz,其中Mz為遺忘強(qiáng)度閾值,則刪除該葉子結(jié)點(diǎn);若分支結(jié)點(diǎn)包含的葉子結(jié)點(diǎn)為空,則刪除該分支結(jié)點(diǎn),以此類推;
步驟5 更新GMT的各結(jié)點(diǎn)信息,返回步驟3。
針對(duì)葉子結(jié)點(diǎn)被刪除而有可能刪除其父結(jié)點(diǎn)的情況,本文考慮3種 (如圖6所示):
(1)被刪結(jié)點(diǎn)具有不止一個(gè)的兄弟葉子結(jié)點(diǎn)或兄弟普通結(jié)點(diǎn),則直接刪除該葉子結(jié)點(diǎn)。
圖6 葉子結(jié)點(diǎn)被遺忘的3種情形
(2)被刪結(jié)點(diǎn)只有一個(gè)兄弟普通結(jié)點(diǎn),而沒有兄弟葉子結(jié)點(diǎn),則用兄弟普通結(jié)點(diǎn)來替代其父結(jié)點(diǎn);
(3)被刪結(jié)點(diǎn)只有一個(gè)兄弟子結(jié)點(diǎn)而沒有普通結(jié)點(diǎn),則用它的兄弟葉子結(jié)點(diǎn)來取代它的父結(jié)點(diǎn)。
人類所謂的 “回憶”現(xiàn)象實(shí)質(zhì)上是對(duì)記憶信息的搜索和調(diào)用。這一過程的實(shí)現(xiàn)就是在長(zhǎng)時(shí)記憶存儲(chǔ)系統(tǒng)中搜索信息的唯一標(biāo)識(shí)ID,然后調(diào)用該ID對(duì)應(yīng)的信息。依據(jù)目標(biāo)ID的創(chuàng)建時(shí)間找到與其臨近的GMT,然后針對(duì)GMT使用寬度優(yōu)先算法可以保證找到目標(biāo)結(jié)點(diǎn)。該算法描述如下:
步驟1 令N為初始結(jié)點(diǎn)的列表;
步驟2 若N為空,則退出并返回失敗信號(hào);
步驟3 令當(dāng)前結(jié)點(diǎn)r為N中第一個(gè)結(jié)點(diǎn),然后將r從N中移出;
步驟4 若r為目標(biāo)結(jié)點(diǎn),則退出并返回成功信號(hào);步驟5 否則,將r的子結(jié)點(diǎn)插入到N的末尾,然后返回步驟2。
通過Matlab工具對(duì)上述遺忘算法進(jìn)行了仿真實(shí)驗(yàn),仿真的結(jié)果如圖7-圖9所示。
通過上述計(jì)算,可以看到不同的記憶類型和個(gè)性因子具有不同的遺忘曲線,并且記憶在遺忘的過程中如果得到學(xué)習(xí),其記憶強(qiáng)度會(huì)階躍式增加,這與艾賓浩斯的遺忘特性基本上能夠吻合。
圖9 經(jīng)過t=50和t=100兩次學(xué)習(xí)的遺忘曲線
本文針對(duì)虛擬士兵建模的需要,在分析現(xiàn)有記憶模型不足的基礎(chǔ)上,對(duì)記憶信息進(jìn)行了合理分類,構(gòu)建了記憶信息的編碼、存儲(chǔ)結(jié)構(gòu)和提取算法,并根據(jù)人類遺忘的特點(diǎn),構(gòu)造了記憶的遺忘算法,最后通過Matlab工具對(duì)算法進(jìn)行了驗(yàn)證。結(jié)果表明該算法與實(shí)際情況基本相符,為進(jìn)一步提高虛擬士兵的真實(shí)度和可信度提供了有益的借鑒。但是針對(duì)記憶信息的提取算法還有待于進(jìn)一步改進(jìn),以期進(jìn)一步減少計(jì)算消耗,提高搜索效率。
[1]CHEN Wencheng.Research and realization of virtual battlefield environment[D].Chengdu:Electronic Technology Universit,2009(in Chinese).[陳文成,虛擬作戰(zhàn)訓(xùn)練環(huán)境的研究與實(shí)現(xiàn) [D].成都:電子科技大學(xué),2009.]
[2]LIU Weibin,ZHOU Liang,XING Weiwei,et al.Modeling realistic behaviors and movements of autonomous virtual humans [J].Transactions of Beijing Institute of Techonology,2010,30 (10):1189-1193.
[3]RONG Ming,WANG Qinzhao,LI Xiaolong.Study on 3Dvirtual soldier based on MDL model[J].Journal of System Simulation,2006,18 (4):1062-1064.
[4]YU Yang,JIANG Yuming.Simulation of 3Dvirtual soldiers training [J].Computer Engineering and Applications,2009,45 (22):166-168.
[5]SHI Jie,RONG Ming,LI Xiaolong,et al.Study on simulation of virtual soldier based on Cal3D [D].Hefei:University of Science and Technology of China,2009:532-535.
[6]ZHAO Wei,XIE Xiaofang.Research on aggressive behavior of autonomous virtual soldier [J].Computer Engineering and Applications,2010,46 (32):67-70.
[7]LU Wei,RONG Ming,LI Xiaolong,et al.Simulation research of appearance diversity about virsual solider[D].Hefei:University of Science and Technology of China,2009:370-373.
[8]ZHANG Shujun,BAN Xiaojuan,CHEN Yong,et al.Memorybased cognitive model of artificial fish[J].Computer Engineering,2007,33 (19):33-36.
[9]SUN Libo,SUN Jizhou,LIU Yan,et al.Model for virtual humans based the feedback control[J].Journal of Software,2010,21 (5):1171-1180.
[10]NI Hui.Research of the key technologies for autonomous virtual human [D].Tianjin:Tianjin University,2007 (in Chinese).[倪慧.自主虛擬人關(guān)鍵技術(shù)的研究 [D].天津:天津大學(xué),2007.]
[11]LOU Yan,HE Hanwu,LU Yongming,et al.Research and implement on dynamic geometry vision model of virtual autonomous vehicle [J].Journal of System Simulation,2006,18(9):2676-2683.
[12]LI Bing.Perception model of autonomous virtual characters in intelligent virtual environmentss[D].Daqing:Daqing Institute of Petroleum,2008(in Chinese).[李冰.智能虛擬環(huán)境中自主虛擬角色感知模型的研究 [D].大慶:大慶石油學(xué)院,2008.]
[13]LU Qiuqin,HUANG Guangqiu,ZHOU Jiao.Model of intellectualized pinyin input method based on biological memory principles [J].Computer Engineering and Applications,2011,47 (9):56-60.
[14]SHI Zhongzhi.Intelligence science [M].Beijing:Tsinghua University Press,2006(in Chinese). [史忠植.智能科學(xué)[M].北京:清華大學(xué)出版社,2006.]
[15]ZUO Saizhe,GUO Yucui,GONG Shangbao,et al.Trust value update model based on the memory theory [J].Journal of Southeast University(Natural Science Edition),2010,40(z2):307-312.