梁汝鵬 鄧克波 毛澤湘 徐沛
1.中國電子科技集團公司第二十八研究所信息系統(tǒng)需求重點實驗室江蘇南京210007
隨著戰(zhàn)爭節(jié)奏逐漸加快,平時籌劃、戰(zhàn)時匹配調(diào)整成為重要作戰(zhàn)模式,預(yù)案匹配方法對于提高作戰(zhàn)快速反應(yīng),并根據(jù)作戰(zhàn)態(tài)勢適度調(diào)整至關(guān)重要.作戰(zhàn)預(yù)案匹配本質(zhì)上是搜索問題,即如何根據(jù)當前情況,快速匹配與預(yù)案庫中相似場景對應(yīng)方案,并擇優(yōu)推薦預(yù)案,其核心是預(yù)案智能匹配方法.
目前,基于關(guān)鍵字或限定規(guī)則等語用層次的硬匹配方法,難以解決作戰(zhàn)場景描述的模糊性問題,針對預(yù)案優(yōu)選難以實現(xiàn)定量化評估[1?2],需要大量人工參與,難以滿足戰(zhàn)時快速匹配需求[3].針對預(yù)案庫的匹配問題通常采用組合關(guān)鍵字的方式,這種方法更適用于完全形式化、確定性目標匹配,要求作戰(zhàn)預(yù)案實現(xiàn)高度格式化、定量化描述,目前作戰(zhàn)預(yù)案存在諸多定性描述,同時預(yù)案多以文本方式存在,傳統(tǒng)的關(guān)鍵字匹配方法難以滿足作戰(zhàn)預(yù)案快速準確匹配需求,在面對作戰(zhàn)方案精確化匹配時存在諸多不足.
同時,目前主流的基于“深度神經(jīng)網(wǎng)絡(luò)”人工智能推薦算法[4?5],需要大量數(shù)據(jù)樣本進行深度學(xué)習與訓(xùn)練,但目前與作戰(zhàn)預(yù)案匹配相關(guān)的數(shù)據(jù)樣本較少,且皆是各國機密,對人工智能深度學(xué)習有較大制約.知識圖譜可在一定程度上實現(xiàn)知識的形式化描述,滿足智能自動化推理需要,針對典型的小樣本問題,通過構(gòu)建軍事知識圖譜,提供了作戰(zhàn)知識的形式化描述,為精細化的作戰(zhàn)預(yù)案匹配查詢提供了新思路.
為解決預(yù)案快速匹配優(yōu)選難題,本文提出了一種基于語義特征的預(yù)案智能匹配方法,通過軍事知識圖譜描述作戰(zhàn)場景的語義特征,并定義各匹配目標方案對應(yīng)的特征向量,基于語義特征的相似性測度,模擬指揮員選擇預(yù)案的過程,滿足預(yù)案定量化快速匹配優(yōu)選要求,實現(xiàn)語義層次的作戰(zhàn)方案智能匹配.
目前,基于特征的匹配與推薦方法研究較多,其中的難點問題在于特征的定義和描述[6?7],對于軍事問題等小樣本特征提取難題,基于知識圖譜的語義特征描述提供了較好的解決方案,一方面可以解決基于關(guān)鍵字等硬匹配方法的固有缺陷,另一方面提供了基于軍事知識庫的特征表達,構(gòu)建基于知識圖譜的預(yù)案匹配方法,為解決作戰(zhàn)預(yù)案的快速智能化預(yù)案匹配提供了新的技術(shù)解決方案,可在一定程度上提高作戰(zhàn)效率.
知識圖譜是以結(jié)構(gòu)化的形式描述客觀世界中的概念、實體及其關(guān)系,將信息表達成接近人類認知世界的形式,并提供一種更好的組織、管理和理解海量信息的能力[8].知識圖譜為海量信息的語義搜索帶來了活力,同時也在智能問答中顯示出強大的威力,已經(jīng)成為知識驅(qū)動的智能應(yīng)用基礎(chǔ)設(shè)施.知識圖譜與大數(shù)據(jù)和深度學(xué)習一起成為推動互聯(lián)網(wǎng)核人工智能發(fā)展的核心驅(qū)動力之一.
隨著戰(zhàn)場信息的爆炸式增長,傳統(tǒng)的搜索方式已經(jīng)無法滿足戰(zhàn)場信息以及大量軍事知識的捕獲和理解需要,而知識圖譜技術(shù)在解決知識查詢的精度以及可擴展性方面展現(xiàn)出了巨大的優(yōu)勢,成為當前研究的熱點問題[9].
現(xiàn)有的知識圖譜多為通用的知識圖譜,針對性較強的領(lǐng)域知識,尤其是軍事領(lǐng)域的知識圖譜并沒有較好的構(gòu)建以及表示方法.因此,建立軍事知識圖譜意義重大.軍事知識涵蓋范圍廣泛,本文定義的軍事知識圖譜主要面向作戰(zhàn)籌劃領(lǐng)域.
在軍事知識圖譜構(gòu)建過程中需要涉及數(shù)據(jù)采集、知識抽取、知識消歧、知識推理等技術(shù)[10],總體流程如圖1所示.
基于知識圖譜,可實現(xiàn)作戰(zhàn)預(yù)案概念語義的形式化定義,由此獲取預(yù)案語義特征的描述,基于語義特征實現(xiàn)智能預(yù)案匹配.
特征即給定屬性集,其中某些屬性可能很關(guān)鍵、很有用,另一些屬性沒什么用,實體屬性即為特征,對于匹配任務(wù)密切相關(guān)的屬性稱為“相關(guān)特征”、對當前任務(wù)無用的屬性稱為“無關(guān)特征”.語義特征即通過知識圖譜描述實體特征,實現(xiàn)實體的語義標注[11].
為獲取關(guān)于預(yù)案描述的語義信息,需要創(chuàng)建預(yù)案特征的語義描述.通過與知識圖譜的映射,定義預(yù)案特征結(jié)構(gòu)化元數(shù)據(jù).基于語義推理工具,語義標注支持預(yù)案語義匹配與發(fā)現(xiàn),例如針對目標定義屬性如圖2所示.
當前,自動語義標注算法無法產(chǎn)生完整、精確的特征標注,可構(gòu)建半自動的特征語義標注算法,實現(xiàn)知識圖譜中概念實體與概念關(guān)系排序.通過人工干預(yù),構(gòu)建預(yù)案特征半自動語義標注流程,實現(xiàn)語義特征映射.
語義標注算法通過分析用戶輸入的作戰(zhàn)預(yù)案查詢關(guān)鍵字,提供了預(yù)案語義特征相關(guān)的概念實體或關(guān)系,并映射到知識圖譜對應(yīng)節(jié)點,經(jīng)過人工干預(yù),利用圖形化人機交互界面,輔助實現(xiàn)特征語義標注[12].
針對作戰(zhàn)預(yù)案采用手工標注工作量大,容易出現(xiàn)錯誤,目前全自動預(yù)案語義特征標注算法尚不成熟.為提高語義特征標注的自動化程度,可在軍事知識圖譜概念術(shù)語匹配基礎(chǔ)算法基礎(chǔ)上,考慮知識圖譜的圖形化特征,可采用顧及軍事知識圖譜概念圖結(jié)構(gòu)的算法優(yōu)化方案,融合PageRank 算法實現(xiàn)更為高效的語義特征概念匹配與特征標注[12],提高語義標注的可靠性,具體過程如圖3所示.
圖2 語義特征
相對于傳統(tǒng)的基于數(shù)據(jù)庫索引和關(guān)鍵字匹配的預(yù)案匹配方法,知識圖譜關(guān)聯(lián)的特征語義標注支持智能邏輯推理,在預(yù)案查詢過程中,語義推理引擎可以精確匹配查詢與服務(wù)的語義標注信息,基于預(yù)案語義特征相似度計算,建立面向特定作戰(zhàn)場景的作戰(zhàn)預(yù)案匹配方法,實現(xiàn)語義級的服務(wù)匹配與發(fā)現(xiàn),確保更為精確的查詢結(jié)果,作戰(zhàn)預(yù)案語義特征匹配機制如圖4所示.
實現(xiàn)作戰(zhàn)預(yù)案語義匹配核心是構(gòu)建預(yù)案匹配規(guī)則與語義特征相似性度量算法.首先,基于作戰(zhàn)要求,構(gòu)建限制性匹配規(guī)則與優(yōu)化類匹配規(guī)則,實現(xiàn)作戰(zhàn)初步篩選;以篩選后預(yù)案為匹配目標集,基于各預(yù)案語義特征標注,抽取語義特征向量,通過建立融合預(yù)案語義特征相似性度量和包含性推理規(guī)則的混合模式預(yù)案匹配機制,實現(xiàn)作戰(zhàn)預(yù)案語義匹配,提高預(yù)案匹配效率和準確度.
3.2.1 限制類約束規(guī)則
對預(yù)案庫的預(yù)案按限制性規(guī)則進行匹配,排除不滿足條件的預(yù)案,縮小匹配預(yù)案集.限制性規(guī)則主要包括幾個方面: 目標的類型、我方力量狀態(tài)等,通過0-1 匹配算法,匹配滿足條件的預(yù)案集合.
3.2.2 優(yōu)化類匹配規(guī)則
對已篩選的預(yù)案集合,利用方案優(yōu)選規(guī)則,考慮目標的重要程度、目標毀傷程度、突防概率等,并利用基于特征向量的相似匹配算法,按優(yōu)先級排序推薦預(yù)案,主要包括目標相似度、毀傷匹配度等.同時根據(jù)突防概率,可自動對作戰(zhàn)力量進行排序,支持人工選擇作戰(zhàn)武器[13?15].
圖3 基于知識圖譜的語義特征標注
圖4 基于語義特征的匹配機制
通過專家評價、樣本訓(xùn)練等方式,確定特征參數(shù),并進行歸一化處理,利用余弦相似度方法[16?18]進行相似度排序,如表1所示.
采用三級匹配機制(圖5),一是作戰(zhàn)場景定義,根據(jù)情報和上報信息,計算/預(yù)估對我方毀傷,遭襲目
圖5 預(yù)案匹配流程
表1 作戰(zhàn)預(yù)案匹配規(guī)則及輸入輸出表
圖6 語義匹配技術(shù)體系
標的類型、目標對我方的重要程度,根據(jù)作戰(zhàn)規(guī)則和作戰(zhàn)意圖,確定目標類型、反擊強度,實現(xiàn)“目標向量”定義;二是預(yù)案語義特征相似度計算,基于作戰(zhàn)預(yù)案語義特征標注,實現(xiàn)特征向量抽取,獲取各個預(yù)案的“語義特征向量”,依據(jù)匹配規(guī)則,基于語義特征向量的相似度計算方法,實現(xiàn)特征向量排序因子計算; 三是基于匹配因子,實現(xiàn)預(yù)案匹配,并依據(jù)當前作戰(zhàn)力量狀態(tài)實現(xiàn)作戰(zhàn)預(yù)案的二次篩選,最終形成作戰(zhàn)預(yù)案匹配集合[19?20].
預(yù)案匹配主要包括3 方面內(nèi)容:匹配規(guī)則設(shè)計、匹配因子和特征向量抽取、語義匹配算法設(shè)計等方面的技術(shù),如圖6所示.
3.4.1 預(yù)案匹配規(guī)則
以作戰(zhàn)需求和作戰(zhàn)特點為基礎(chǔ),開展預(yù)案匹配規(guī)則研究,作為預(yù)案匹配技術(shù)決策的基礎(chǔ)和輸入,滿足預(yù)案匹配的科學(xué)、快速要求.
3.4.2 語義特征向量抽取
結(jié)合作戰(zhàn)預(yù)案結(jié)構(gòu)和內(nèi)容,分析預(yù)案匹配所需的組成要素,基于作戰(zhàn)預(yù)案語義標注,設(shè)計形成匹配因子和語義特征向量,以及匹配因子權(quán)重系數(shù),研究匹配因子抽取及量化方法.
3.4.3 預(yù)案匹配算法
根據(jù)作戰(zhàn)需求,研究設(shè)計語義特征相似度計算方法,實現(xiàn)匹配目標向量和預(yù)案特征向量相似度計算,計算作戰(zhàn)預(yù)案排序因子,進行作戰(zhàn)預(yù)案定量化排序.
為解決預(yù)案快速匹配優(yōu)選難題,本文提出了一種基于語義特征的預(yù)案智能匹配方法,通過軍事知識圖譜描述作戰(zhàn)場景的語義特征,并定義各匹配目標方案對應(yīng)的語義特征,基于語義特征的相似性測度,模擬指揮員選擇預(yù)案的過程,滿足預(yù)案定量化快速匹配優(yōu)選要求,實現(xiàn)語義級作戰(zhàn)方案智能匹配.
針對作戰(zhàn)預(yù)案匹配模型小樣本的訓(xùn)練問題,尚有眾多問題需要解決,可在作戰(zhàn)演訓(xùn)過程中不斷積累特征標注數(shù)據(jù)和訓(xùn)練樣本,逐步對預(yù)案匹配模型進行優(yōu)化.