国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于人工智能的兵棋推演作戰(zhàn)分析研究與設(shè)計*

2015-03-14 10:58:56鐘劍輝傅調(diào)平
艦船電子工程 2015年1期
關(guān)鍵詞:兵棋藍方戰(zhàn)斗力

鐘劍輝 傅調(diào)平 鄧 超

(1.海軍陸戰(zhàn)學(xué)院研究生隊 廣州 510431)(2.海軍陸戰(zhàn)學(xué)院模擬訓(xùn)練中心 廣州 510431)

?

基于人工智能的兵棋推演作戰(zhàn)分析研究與設(shè)計*

鐘劍輝1傅調(diào)平2鄧 超1

(1.海軍陸戰(zhàn)學(xué)院研究生隊 廣州 510431)(2.海軍陸戰(zhàn)學(xué)院模擬訓(xùn)練中心 廣州 510431)

20世紀(jì),隨著計算機的出現(xiàn),使得繁瑣、嚴(yán)格的兵棋規(guī)則可以在計算機中處理,馮·萊斯威茨父子發(fā)明的兵棋迎來了新的春天。論文首先從戰(zhàn)斗力度量、戰(zhàn)斗結(jié)果裁判兩方面詳細分析了兵棋推演與其它戰(zhàn)爭分析方法的聯(lián)系,并總結(jié)了兵棋推演應(yīng)用于戰(zhàn)爭分析的實踐意義。接著以兵棋推演為基礎(chǔ),介紹了相關(guān)的對策論、有信息的對抗搜索和局部優(yōu)化搜索等人工智能技術(shù)。最后以一個戰(zhàn)術(shù)想定為背景,詳細闡述了設(shè)計兵棋系統(tǒng)時應(yīng)用人工智能需要解決的數(shù)字化、博弈樹生成和局面評估等問題。

戰(zhàn)爭分析; 兵棋推演; 機器博弈; 人工智能

Class Number TP18

1 引言

兵棋是普魯士軍人馮·萊斯威茨父子于19世紀(jì)發(fā)明的一種作戰(zhàn)模擬器材,以棋盤來描述地形、地貌,用棋子來描述作戰(zhàn)實體和事件,并引入了作戰(zhàn)經(jīng)驗和時間概念,在軍事人員的參與下形成基于數(shù)學(xué)計算的作戰(zhàn)模擬系統(tǒng)。兵棋可定義為:以推演回合流程、規(guī)則和數(shù)據(jù)裁決兩方或多方對抗行動的作戰(zhàn)模擬工具[1]。

由于馮·萊斯威茨父子發(fā)明的兵棋規(guī)則繁瑣且嚴(yán)格,普魯士軍人馮·凡爾第把兵棋變成一種圖上作業(yè),使得對陣結(jié)果主要依據(jù)有經(jīng)驗的軍官來判斷,而不是詳細的兵棋規(guī)則。圖上作業(yè)雖然簡單易行,但在對陣結(jié)果的評判上因為引入的主觀因素較多,使這種作戰(zhàn)模擬在客觀性方面不如兵棋。

20世紀(jì),計算機的出現(xiàn)使得繁瑣、嚴(yán)格的兵棋規(guī)則可以在計算機中處理,馮·萊斯威茨父子發(fā)明的兵棋迎來了新的春天。本文討論的兵棋,就是這種具有繁雜推演規(guī)則的嚴(yán)格式兵棋,其對陣結(jié)果的評判不依賴于某個人的判斷。本文首先分析了兵棋推演在諸多戰(zhàn)爭分析方法中的地位,接著介紹了應(yīng)用推演方式分析戰(zhàn)爭的技術(shù)基礎(chǔ),最后以一個戰(zhàn)術(shù)想定為背景,詳細闡述了設(shè)計兵棋系統(tǒng)時應(yīng)用人工智能需要解決的數(shù)字化、博弈樹生成和局面評估等問題。

2 基于兵棋推演的作戰(zhàn)分析方法

兵棋推演的本質(zhì)是“推演”,而推演是基于仿真與實驗的戰(zhàn)爭分析方法之一。兵棋推演的分析方法離不開其它定量分析方法,離開了定量分析,兵棋推演就是無水之源、無木之本。

2.1 基于兵棋推演的分析方法與其它分析方法的聯(lián)系

人們在探索、發(fā)現(xiàn)戰(zhàn)爭規(guī)律的實踐過程中,不僅創(chuàng)造了軍事理論,同時也總結(jié)出了許多戰(zhàn)爭分析的方法。這些戰(zhàn)爭分析的方法主要包括基于歷史與經(jīng)驗的分析方法、基于解析的分析方法、基于仿真與實驗的分析方法以及綜合分析方法,如圖1所示[2]。

基于兵棋推演的分析方法與其它分析方法有著密切的聯(lián)系,主要涉及如下幾個方面:

1) 兵棋棋子戰(zhàn)斗力值的度量。在兵棋推演的戰(zhàn)斗結(jié)果裁決中,為了方便作戰(zhàn)模擬的組織實施,讓所有的戰(zhàn)斗力值都等價。為了得到等價戰(zhàn)斗力值,需要用到基于歷史經(jīng)驗的定量分析方法。

2) 兵棋推演中戰(zhàn)斗結(jié)果的裁判。戰(zhàn)斗結(jié)果的數(shù)據(jù)可以利用基于隨機仿真實驗的統(tǒng)計試驗法與基于半經(jīng)驗半理論的蘭徹斯特方程結(jié)合生成。

圖1 戰(zhàn)爭系統(tǒng)分析方法

3) 兵棋推演中的決策離不開基于嚴(yán)格數(shù)學(xué)理論的方法,如對策論。對策論把策略選擇的得失表示為定量形式進行研究,為最優(yōu)策略的選擇提供一種算法。

表1 海灣戰(zhàn)爭兵棋中的各國聯(lián)隊?wèi)?zhàn)斗力值(節(jié)選)

表2 海灣戰(zhàn)爭兵棋中的地面戰(zhàn)斗結(jié)果表

2.2 戰(zhàn)斗力值的度量

在作戰(zhàn)模擬分析中,對部隊整體戰(zhàn)斗力的度量標(biāo)準(zhǔn),稱為戰(zhàn)斗力值。戰(zhàn)斗力值的量化過程采取了完全經(jīng)驗式的途徑。首先,根據(jù)歷史經(jīng)驗給武器殺傷力確定量化標(biāo)準(zhǔn);然后,在此基礎(chǔ)上附加各種影響武器殺傷力的量化因素;最后,把得出的這些量化標(biāo)準(zhǔn)放到歷史戰(zhàn)例中去檢驗,通過不斷修正獲得最接近戰(zhàn)例實際的戰(zhàn)斗力值。

美國軍事歷史學(xué)家杜派在武器的理論殺傷力指數(shù)和應(yīng)用殺傷力指數(shù)的基礎(chǔ)上,設(shè)計出軍隊?wèi)?zhàn)斗力的框架結(jié)構(gòu),即定量判定模型。這個理論包括兩個部分:戰(zhàn)斗實力值和戰(zhàn)斗潛力值。戰(zhàn)斗實力值是經(jīng)過環(huán)境因子修正的應(yīng)用殺傷力指數(shù)總值;戰(zhàn)斗潛力值是經(jīng)過戰(zhàn)斗因子修正的戰(zhàn)斗實力值。比較敵我雙方戰(zhàn)斗潛力值的大小,可以對戰(zhàn)斗效果的可能性做出推測[3]。

為了方便作戰(zhàn)模擬的組織實施,就要使作用于相同目標(biāo)的戰(zhàn)斗力值有一個統(tǒng)一的價值標(biāo)準(zhǔn),即作用于同一個目標(biāo)上的各軍兵種兵力兵器的戰(zhàn)斗力值可以相加,同一場戰(zhàn)斗中敵我雙方的戰(zhàn)斗力值可以相減或相乘。表1中例舉了美國1990年出版的模擬海灣戰(zhàn)爭的兵棋中使用的近千種等價戰(zhàn)斗力值的一部分。

2.3 戰(zhàn)斗結(jié)果的裁判

有了等價戰(zhàn)斗力,就能對敵對雙方的戰(zhàn)斗結(jié)果進行基本裁判。兵棋推演存在許多不確定性,需要抽取隨機數(shù),導(dǎo)致相同的策略下可能產(chǎn)生很多不同的戰(zhàn)斗結(jié)果[4]。在戰(zhàn)果的裁判中,還需要引入偶然因素。表2為海灣戰(zhàn)爭兵棋中的地面戰(zhàn)斗結(jié)果表。表中的結(jié)果既可以來自戰(zhàn)爭經(jīng)驗中的戰(zhàn)例統(tǒng)計,也可以利用統(tǒng)計試驗法與蘭徹斯特方程結(jié)合生成。

這種基于戰(zhàn)例統(tǒng)計、統(tǒng)計試驗的方法,在兵棋中有著非常廣泛的應(yīng)用,傷亡、轟炸、偵察、射擊、電子對抗、氣象、投降等由偶然因素導(dǎo)致的事件,都設(shè)計有專門的概率表,用以確定某一事件是否會發(fā)生及其對戰(zhàn)局會造成什么樣的影響。

2.4 基于兵棋推演的戰(zhàn)爭分析方法應(yīng)用于戰(zhàn)爭分析實踐的意義

與其它分析方法相比較,基于兵棋推演的戰(zhàn)爭分析方法在戰(zhàn)爭分析實踐的應(yīng)用,具有特殊的意義。

1) 使軍事人員在對戰(zhàn)爭的動態(tài)性研究中牢固樹立定量分析的思想。隨著運籌學(xué)在第二次世界大戰(zhàn)后的快速發(fā)展,解析分析方法得到了廣泛的運用。但這種以解析計算為手段的研究方法,即使引入隨機變量來考慮隨機性因素,一旦初始條件確定,其作戰(zhàn)的結(jié)果基本上也是確定的,難以反映戰(zhàn)爭過程中各個體系之間的動態(tài)對抗、不斷演化的特性。而基于兵棋推演的戰(zhàn)爭分析方法,既能反映戰(zhàn)爭的動態(tài)、演化特性,同時基于等價戰(zhàn)斗力的戰(zhàn)果裁決方法的廣泛應(yīng)用,又使動態(tài)的作戰(zhàn)推演也能實現(xiàn)定量分析。

2) 數(shù)字化的兵棋使人工智能技術(shù)能夠應(yīng)用于戰(zhàn)爭的動態(tài)分析中。人工智能、機器博弈技術(shù)的相關(guān)理論及其應(yīng)用取得了很大的成功,尤其在下棋方面的智能,甚至已經(jīng)超過了人類。在戰(zhàn)爭的靜態(tài)研究中,計算機技術(shù)的應(yīng)用已經(jīng)取得了很大的成功;而兵棋推演在戰(zhàn)爭分析中得到積極的應(yīng)用,是在戰(zhàn)爭的動態(tài)研究中應(yīng)用計算機技術(shù)的基礎(chǔ)。

3 兵棋推演中應(yīng)用人工智能的理論基礎(chǔ)

3.1 對策論

對策論又稱博弈論,是研究具有對抗或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。在這類對策現(xiàn)象中,參加競爭或?qū)沟母鞣骄哂胁煌睦婧湍繕?biāo)。為了達到各自的利益和目標(biāo),各方必須考慮對手的各種可能的行動方案,并力圖選擇對自己最有利或最合理的方案[5]。

為對對策現(xiàn)象進行數(shù)學(xué)上的分析,需要建立對策問題的數(shù)學(xué)模型,稱為對策模型。對策模型包括三個基本要素:局中人、策略和贏得函數(shù)。

“局中人”確定了有權(quán)決定自己行動方案的對策參加者,對策論中對局中人的一個重要假設(shè)是:每個局中人都是理智的?!安呗浴笔菍Σ咧锌晒┚种腥诉x擇的一個實際可行的完整的行動方案。一個對策中,每一個局中人所出策略形成的策略組稱為一個局勢。設(shè)si是第i個局中人的一個策略,則n個局中人的策略形成的策略組:

S=(s1,s2,…,sn)

S就是一個局勢。當(dāng)一個局勢S出現(xiàn)后,應(yīng)該為每一局中人i規(guī)定一個贏得值Hi(S)。Hi(S)稱為局中i的“贏得函數(shù)”。

圖2 一棵兩層的雙人博弈樹

在對策現(xiàn)象中,由初始狀態(tài)、后繼函數(shù)、終止測試和贏得函數(shù)等要素定義了一個博弈樹。如圖2所示是一棵兩層的雙人博弈樹[7]。節(jié)點A的值由紅方選擇,節(jié)點B、C、D的值由藍方選擇,終止節(jié)點顯示了紅方的贏得值,值越高被認為對紅方越有利,而對藍方則越不利。所以,節(jié)點B、C、D的值由藍方選擇所屬葉子節(jié)點的最小值3、2、2;節(jié)點A的值由紅方選擇最大值3。在對策中,紅方的任務(wù)是利用博弈樹來確定最佳策略,特別是終止?fàn)顟B(tài)的贏得值。

3.2 有信息的對抗搜索

根據(jù)對策論,問題的求解過程轉(zhuǎn)變?yōu)樵诓┺臉渲兴阉鹘獾倪^程,通過遍歷博弈樹,找出符合條件的一個終止節(jié)點。這種搜索策略被稱為無信息搜索,按照擴展節(jié)點的次序,可分為深度優(yōu)先搜索、寬度優(yōu)先搜索、一致耗費搜索[6]。

現(xiàn)實中常常遇到這樣的對策現(xiàn)象,由于其博弈樹的節(jié)點數(shù)太多,很少有計算機的主存大小能夠滿足遍歷博弈樹所需的存儲,而且時間上也不允許。一個典型的例子是國際象棋,其平均分支因子大約是35,一盤棋每個游戲者一般走50步,所以博弈樹大約有35100或者10154個節(jié)點。這意味著現(xiàn)有計算能力無法找出這類問題的最優(yōu)決策,無信息搜索策略在這類問題上是無效的。

為此,需要應(yīng)用有信息的搜索策略來處理這類問題。通過截斷函數(shù)將非終止節(jié)點有效地轉(zhuǎn)變?yōu)槿~子終止節(jié)點,然后由評價函數(shù)對要擴展的節(jié)點進行選擇,使得在最優(yōu)決策不可處理的情況下,也能做出和取勝的實際機會密切相關(guān)的決策。

搜索的性能表現(xiàn)取決于評價函數(shù)的質(zhì)量,質(zhì)量好的設(shè)計應(yīng)具備如下特征: 1) 評價函數(shù)應(yīng)該以贏得函數(shù)同樣的方式對終止?fàn)顟B(tài)進行排序; 2) 評價函數(shù)的計算不能花費太多的時間; 3) 評價函數(shù)對于非終止?fàn)顟B(tài)的估值應(yīng)該和取勝的實際機會密切相關(guān)。

評價函數(shù)的關(guān)鍵元素是基于問題給予的額外信息而設(shè)計的啟發(fā)函數(shù)。啟發(fā)函數(shù)的實現(xiàn)有很多方式,其中一種是計算每個特征單獨的數(shù)值貢獻,然后把它們結(jié)合起來找到一個總值。數(shù)學(xué)上稱這種函數(shù)為加權(quán)線性函數(shù)

E(s)=w1f1(s)+w2f2(s)+…+wnfn(s)

其中,每個wi是一個權(quán)值,fi是棋局的某個特征。

啟發(fā)函數(shù)的應(yīng)用,一個成功例子是中國象棋對弈程序。根據(jù)著名象棋理論家黃少龍?zhí)岢龅睦碚?可依照千分制的計算方式,制作子力分值表,用于局面評估。比如,帥:無限大;車:1000分;馬:開局時400分,中局時450分,殘局時500分等等。除了子力分值之外,還有棋子的靈活性、棋盤控制、棋子關(guān)系等因素需要考慮[8]。加入這些因素能提高評價函數(shù)的知識水平,詳細的論述可參考文獻[7]。

3.3 局部搜索算法

根據(jù)對抗搜索理論,搜索的關(guān)鍵是評價函數(shù)的設(shè)計,其中啟發(fā)函數(shù)是所求特征的線性或非線性的加權(quán)組合,因此,特征權(quán)值的確定是評價函數(shù)設(shè)計的重點。

假設(shè)啟發(fā)函數(shù)有n個特征,則其權(quán)值數(shù)組為[w1,w2,…,wn]。數(shù)組的一個取值稱為一個具有n個分量的狀態(tài),當(dāng)其中一個狀態(tài)分量發(fā)生變化,則由一個狀態(tài)轉(zhuǎn)變?yōu)榱硪粋€狀態(tài),且這兩個狀態(tài)稱為相鄰狀態(tài)。數(shù)組的所有取值組成了狀態(tài)空間。

上述特征數(shù)組的一個狀態(tài)對應(yīng)對抗搜索中的一種啟發(fā)函數(shù)。我們需要找到一種方法來尋找狀態(tài)空間中的最優(yōu)狀態(tài),稱為最優(yōu)化問題。一種方法是人工調(diào)整,根據(jù)經(jīng)驗,能夠確定一些狀態(tài)分量值的大小及比例。設(shè)置這些狀態(tài)分量,并通過與機器反復(fù)對弈,測試獲勝機率;然后根據(jù)其它經(jīng)驗改變狀態(tài)分量,試驗程序的能力是增強還是降低了;經(jīng)過多次測試找出一個較優(yōu)的狀態(tài)。另一種方法是通過計算機程序輔助,在狀態(tài)空間中搜索最佳狀態(tài)。

在對抗搜索中,當(dāng)找到目標(biāo)時,到達目標(biāo)的路徑同時也構(gòu)成了這個問題的一個解。然而在啟發(fā)函數(shù)的特征權(quán)值的優(yōu)化問題中,到達目標(biāo)的路徑與最終路徑是無關(guān)的。解決這類優(yōu)化問題的算法稱為局部搜索算法,算法從一個當(dāng)前狀態(tài)出發(fā),通過某種方式在狀態(tài)空間中選擇最佳相鄰狀態(tài)作為當(dāng)前狀態(tài),直至找到符合目標(biāo)函數(shù)的最佳狀態(tài)。

局部搜索根據(jù)選擇相鄰狀態(tài)的方式的不同,可分為爬山法搜索、模擬退火法搜索、局部剪枝搜索和遺傳算法搜索。

爬山法搜索又稱貪婪局部搜索,它只選擇相鄰狀態(tài)中最好的一個,其成功與否在很大程度上取決于狀態(tài)空間地形圖的形狀,局部最大值、局部平坦值會影響到最優(yōu)狀態(tài)的搜索。為了解決這個問題,已經(jīng)發(fā)展了幾種隨機算法,用于跳出局部最大和平坦值。

模擬退火搜索是允許下山的爬山法搜索,它隨機選擇一個狀態(tài)作為相鄰狀態(tài)。如果該狀態(tài)優(yōu)于當(dāng)前狀態(tài),則接受該狀態(tài)為當(dāng)前狀態(tài);否則,以某個小于1的概率接受該狀態(tài)為當(dāng)前狀態(tài)。這個概率以狀態(tài)評價指數(shù)和倒計時間T為參數(shù),隨機相鄰狀態(tài)惡化程度越大,被選上的概率越??;T越接近0,被選上的概率越大。

局部剪枝搜索以k個隨機生成的狀態(tài)開始。然后生成全部k個狀態(tài)的所有后繼狀態(tài),形成后繼列表。接著從后繼列表中選擇k個最佳的后繼,直至后繼列表中存在目標(biāo)狀態(tài)。如果一個狀態(tài)生成了幾個好的狀態(tài)都在k個最佳的后繼中,狀態(tài)群很快聚集到狀態(tài)空間中的一小塊區(qū)域內(nèi)。因此,局部剪枝搜索的缺陷是會使?fàn)顟B(tài)缺乏多樣性。解決這個問題的方法是按一定概率隨機地選擇k個后繼狀態(tài),這個概率是狀態(tài)評價值的遞增函數(shù)。

對于一些非線性、多模型、多目標(biāo)的函數(shù)優(yōu)化問題,用其他優(yōu)化方法較難求解,遺傳算法卻可以方便地得到較好的結(jié)果[9]。遺傳算法搜索是隨機剪枝搜索的一個變化形式,它不是通過狀態(tài)的相鄰關(guān)系來生成后繼的,而是通過隨機配對兩個父狀態(tài)結(jié)合生成后繼,稱為雜交。生成的后繼狀態(tài)數(shù)組是以隨機位置為雜交點,前后兩部分分別屬于兩個父狀態(tài)數(shù)組的一個新數(shù)組。狀態(tài)的評價值與其它狀態(tài)結(jié)合的概率成正比。搜索過程的早期,狀態(tài)是多樣化的,到了后期,隨著狀態(tài)相似度的提高,結(jié)合生成的后繼狀態(tài)的變化減少,這點類似于模擬退火。

4 兵棋仿真系統(tǒng)的設(shè)計

兵棋仿真系統(tǒng)的設(shè)計需要解決如下幾個問題: 1) 兵棋各要素的數(shù)字化,包括棋盤、棋子及規(guī)則的數(shù)字化; 2) 博弈樹的生成,包括主要是由規(guī)則庫構(gòu)成的后繼函數(shù)、戰(zhàn)果判斷函數(shù); 3) 局面的評估,包括局面特征的選擇、特征加權(quán)值的優(yōu)化。

4.1 想定描述

為了問題描述的方便,參考文獻[10]中的一個作戰(zhàn)想定來描述系統(tǒng)的設(shè)計。

4.1.1 背景

C國和P國之間長期以來一直存在H島的爭議,由于歷史原因,幾十年來,H島一直由P國實際控制。C國派遣巡邏艇等在H島附近海域進行常態(tài)化巡邏,保護本國漁船并宣示主權(quán)。

作為對C國巡邏的反制,P國也計劃派遣艦艇前往相關(guān)海域,并企圖登島。為了本國的海洋權(quán)益,C國也緊急抽調(diào)一支增援編隊趕往事發(fā)海域,與前線艦只共同守衛(wèi)海島主權(quán)[10]。

4.1.2 雙方兵力對比

C國(以下稱紅方)的兵力組成包括:三艘巡邏艇(X),五艘快艇(K),一艘輕型護衛(wèi)艦(F),以及一支包括二艘巡邏艇和一艘快艇的增援編隊。

P國(以下稱藍方)的兵力組成包括:三支小型編隊以及一艘登陸艦。

4.1.3 雙方作戰(zhàn)使命

藍方計劃分兩個梯次,第一梯次派出兩支編隊分別從南北兩個方向向H島挺進,其中一個路線是主攻方向,另一個則為助攻方向。作戰(zhàn)任務(wù)是擊退前來攔截的紅方艦艇,為后續(xù)登陸提供保障。第二梯次,登陸艦在小型編隊護送下,突破紅方防御,實現(xiàn)登陸的作戰(zhàn)目標(biāo)。

紅方為了阻止藍方逼近H島,在外圍海域構(gòu)建了一道防線,對藍方的兩條進攻路線進行攔截,如果防御不利,緊急增援編隊來不及休整就必須加入作戰(zhàn)。雙方的初始態(tài)勢如圖3所示。

圖3 初始態(tài)勢圖

4.2 兵棋要素的數(shù)字表示

4.2.1 棋盤表示

采用正六邊形網(wǎng)格來量化地形,如圖4所示。

圖4 棋盤表示

設(shè)原點坐標(biāo)為(0,0),則綠格坐標(biāo)為(3,4)。因此棋盤可用一個二維數(shù)組來表示:

數(shù)組中數(shù)值0表示白色格,數(shù)值1表示綠色格。

這種坐標(biāo)系與直角坐標(biāo)系不同,格與格之間的位置關(guān)系不能用二維數(shù)組中相鄰元素來表示。坐標(biāo)為(x,y)的格,其相鄰格集合Φ為

Φ= {(x-1,y),(x+1,y),(x,y-1),

(x,y+1),(x-1,y-1)}

如圖5所示。

圖中的橙格與綠格相鄰,藍格距離綠格兩步。用數(shù)值2、3分別表示橙格與藍格,這樣二維數(shù)組為

圖5 格與格之間的關(guān)系

4.2.2 棋子表示

棋盤二維數(shù)組的數(shù)據(jù)類型為三個數(shù)據(jù)的結(jié)構(gòu)體,第一個用于標(biāo)該位置是否有兵力以及兵力是紅方還是藍方;第二個用于標(biāo)識地形類型;第三個是一個數(shù)組地址,該數(shù)組中存儲有處于該位置的兵力信息,遍歷數(shù)組能計算出兵力疊加后的攻、防值。

本例中兵力組成不多,分別用數(shù)字1~5來表示C國巡邏艇、快艇、輕型護衛(wèi)艦以及P國小型編隊、登陸艦。

4.2.3 戰(zhàn)斗力表示

根據(jù)3.3節(jié)的戰(zhàn)斗力值的度量,參考成熟兵棋的等價戰(zhàn)斗力量,考慮本想定的兵力情況,戰(zhàn)斗力值只涉及艦對艦進攻戰(zhàn)斗力值,艦對艦防御戰(zhàn)斗力值。具體值如表3所示。

表3 戰(zhàn)斗力值

4.3 走法產(chǎn)生器

4.3.1 一般規(guī)則

經(jīng)過簡化,棋子的走法遵循如下規(guī)則:

1) 紅、藍雙方以回合制的方式輪流走子;

2) 每個回合可以對所有棋子進行操作;

3) 每一回合每一個棋子只能走一格;

4) 兵力的移動受到地形的限制;

5) 登島需要兩個回合的時間;

6) 同一方的棋子可以處于一格內(nèi)。

與交戰(zhàn)相關(guān)的規(guī)則簡化如下:

1) 進入已有敵方兵力存在的格子即為交戰(zhàn);

2) 棋子的探測距離為一格;

3) 同一格內(nèi)的同方棋子攻、防值可疊加;

4) 相鄰格的同方棋子的攻、防值疊加可忽略不計。

4.3.2 戰(zhàn)術(shù)規(guī)則

根據(jù)戰(zhàn)術(shù)目的,確定勝負規(guī)則如下:

1) 藍方登陸艦進入H島相鄰格且未被紅方攻擊,則藍方能順利登島,藍方勝;

2) 藍方登陸艦生命值為0,則藍方敗;

3) 40回合內(nèi),藍方未能登島,則判藍方輸。

其他兵力戰(zhàn)術(shù)運用規(guī)則:

紅方后備兵力在雙方交戰(zhàn)前只能在H島相鄰格活動,雙方交戰(zhàn)后根據(jù)戰(zhàn)果選擇支援方向;

4.3.3 走法產(chǎn)生器的設(shè)計

走法產(chǎn)生器包括下面幾個重要的函數(shù):

1) 根據(jù)上述規(guī)則,設(shè)計走法合法性判斷函數(shù);

2) 設(shè)計走法生成函數(shù),函數(shù)有三個形參,包括當(dāng)前棋盤狀態(tài)、當(dāng)前走法的層次、哪一方棋子的走法。該函數(shù)遍歷棋盤狀態(tài)下操作方的所有棋子,并通過合法性判斷函數(shù)篩選出合法走法存入當(dāng)前層次的數(shù)組。

4.4 局面估值函數(shù)

以兵棋要素的數(shù)據(jù)表示及走法產(chǎn)生器的設(shè)計為基礎(chǔ),我們能夠生成博弈樹。根據(jù)第3節(jié)中介紹的對抗搜索理論,局面估值函數(shù)是博弈樹中選擇擴展節(jié)點的關(guān)鍵,這也是人工智能在兵棋推演中運用的核心。我們設(shè)計局面估值函數(shù)時,可選擇“棋子基本價值”、“棋子位置附加值”、“棋子間關(guān)系”作為局面的特征。

棋子的基本價值能夠反映一個態(tài)勢的最基本的情況,是估值的過程所不能缺少的。

圖6 棋子位置附加值示意圖

處于不同位置的兵力,其對達成作戰(zhàn)目標(biāo)的貢獻的大小是不同的。根據(jù)本案例的戰(zhàn)術(shù)目的,棋子越靠近H島,其附加值越高。

我們設(shè)定藍方的棋子位置附加值如圖6所示,以H島為中心,由里向外,第1~10圈的附加值數(shù)列為(110,90,70,70,50,50,50,30,30,30)。

附加值矩陣如下所示:

紅方棋子的位置附加值與藍方類似,其附加值矩陣如下所示:

棋子間的關(guān)系包括:棋子靈活性、被威脅的信息、被保護的信息、棋子間的配合等。在本想定中,藍方兵力靠近H島其價值會增加,但如果紅方兵力在旁邊,則價值會大打折扣。藍方登陸艦是其實現(xiàn)戰(zhàn)術(shù)目的的關(guān)鍵,如果作戰(zhàn)編隊的護航,其價值也會降低。

特征選擇及其權(quán)值的確定應(yīng)充分考慮戰(zhàn)法、戰(zhàn)術(shù)及兵力使用的細節(jié)問題。這也正是兵棋推演的價值所在。

5 結(jié)語

手工兵棋在作戰(zhàn)裁決方面,棋子戰(zhàn)斗力以攻防值描述,基本采用力量對比方式,通過表格進行裁決和修正,并考慮偶然性因素,最終得到裁決的結(jié)果。其優(yōu)點是裁決規(guī)則簡單,可以用于各類部隊,不需要對每個棋子都重新建模;缺點也很明顯,一般只適于規(guī)模較小的行動,不太適合高速平臺及精確武器的作戰(zhàn)行動,難以完成復(fù)雜的聯(lián)合作戰(zhàn)行動的模擬。

古老的兵棋推演方法再次引起人們的興趣,與其適于應(yīng)用于計算機技術(shù)是分不開的。傳統(tǒng)的兵棋需要采用更多的信息化技術(shù),可以在新的信息化系統(tǒng)中加以體現(xiàn),最終發(fā)展成為計算機模擬系統(tǒng)。而采用計算機化的模擬系統(tǒng),模型規(guī)則亟待設(shè)計完整,這正是計算機兵棋系統(tǒng)所要研究和解決的問題

[1] 何昌其.戰(zhàn)術(shù)兵棋發(fā)展應(yīng)用研究[M].北京:解放軍出版社,2012:14.

[2] 胡曉峰,等.戰(zhàn)爭復(fù)雜系統(tǒng)仿真分析與實驗[M].北京:國防大學(xué)出版社,2008:100-176.

[3] 楊南征.虛擬演兵——兵棋、作戰(zhàn)模擬與仿真[M].北京:解放軍出版社,2007:163-176.

[4] 李乃金.兵棋推演人機博弈決策模型的設(shè)計與實現(xiàn)[D].沈陽:東北大學(xué),2009:4.

[5] 胡運權(quán).運籌學(xué)教程[M].第三版.北京:清華大學(xué)出版社,2007:371.

[6] 胡桐清.人工智能軍事應(yīng)用教程[M].北京:軍事科學(xué)出版社,1999:9-17.

[7] 姜哲,等譯.人工智能——一種現(xiàn)代方法[M].第二版.北京:人民郵電出版社,2010:127.

[8] 王小春.PC游戲編程(人機博弈)[M].重慶:重慶大學(xué)出版社,2002:26-27.

[9] 傅調(diào)平,陳建華,李剛強.海戰(zhàn)智能輔助決策技術(shù)及應(yīng)用[M].軍事科學(xué)出版社,2010.

[10] 魯大劍.面向作戰(zhàn)推演的博弈與決策模型及應(yīng)用研究[D].南京:南京理工大學(xué),2013:47-49.

Research and Design of Wargaming Combat Analysis Based on AI

ZHONG Jianhui1FU Tiaoping2DENG Chao1

(1. Graduate Student, Naval Marine Academy, Guangzhou 510430) (2. The Simulation Center, Naval Marine Academy, Guangzhou 510431)

In the 20th Century, with the appearance of computer, the complicated and strict wargame can be processed in computer, thus the wargame invented by Feng rice witts Father receives a new spring. From the aspects of combat strength, and combat result judgement, the relationship between wargame deduction and other combat analysis method is analyzed in detail, and the practical significance of wargame deduction in combat analysis is summarized. Then based on the wargame deduction, the related countermeasure theory, information search and local search optimization are introduced. Finally, in a tactical scenario, the application of artificial intelligence in solving the digital is analyzed.

combat analysis, wargame, game machine, AI

2014年7月8日,

2014年8月27日

鐘劍輝,男,碩士研究生,研究方向:戰(zhàn)術(shù)建模與仿真、人工智能。傅調(diào)平,男,博士,教授,碩士生導(dǎo)師,研究方向:戰(zhàn)術(shù)理論、人工智能、戰(zhàn)術(shù)建模與仿真。鄧超,男,碩士,研究方向:戰(zhàn)術(shù)建模與仿真。

TP18

10.3969/j.issn1672-9730.2015.01.007

猜你喜歡
兵棋藍方戰(zhàn)斗力
“和”文化激發(fā)偏遠井站戰(zhàn)斗力
中國石化(2021年8期)2021-11-05 07:00:16
兵棋推演:未來戰(zhàn)爭的水晶球
軍事文摘(2020年19期)2020-10-13 12:29:28
基于兵棋推演實驗的綜合評估指標(biāo)度量方法
動物軍團的戰(zhàn)斗力
基于深度學(xué)習(xí)的兵棋實體決策效果智能評估模型
基于混合Beta分布的兵棋推演可信度評估方法研究
精彩的足球比賽
暗號
戰(zhàn)斗力大PK
暗號
小小說月刊(2015年5期)2016-01-22 08:39:19
台中县| 绍兴县| 申扎县| 天水市| 镇远县| 逊克县| 丰顺县| 桃园县| 拜泉县| 普兰县| 彰化县| 疏勒县| 哈尔滨市| 昌邑市| 肇庆市| 烟台市| 宁陵县| 鹤壁市| 黄山市| 农安县| 南郑县| 吉林省| 安多县| 元阳县| 东乡县| 樟树市| 凌海市| 乌恰县| 阜南县| 抚宁县| 荥阳市| 洛隆县| 抚远县| 项城市| 北海市| 丹棱县| 金沙县| 砚山县| 习水县| 鹤山市| 修水县|