郭 強,關(guān) 欣,曹昕瑩,張政超,何 友
(1.海軍航空工程學(xué)院 信息融合技術(shù)研究所,山東煙臺 264001;2.中國人民解放軍63880 部隊,河南洛陽 471003)
知識是任意活動的重要資源,隨著網(wǎng)絡(luò)應(yīng)用的增加和服務(wù)質(zhì)量的提高,分布式知識庫的管理日益重要[1]。在很多應(yīng)用領(lǐng)域中,當(dāng)前知識都需要存放在分布式知識庫中,這導(dǎo)致知識客戶需要從分布式知識源進行知識融合。知識融合是知識管理和知識工程的重要組成部分,它主要研究分布式知識庫系統(tǒng)中知識的轉(zhuǎn)換、集成和融合,并產(chǎn)生新的知識,同時對知識對象的結(jié)構(gòu)和內(nèi)涵進行優(yōu)化,提供基于知識的服務(wù)[2~4]。
知識融合是在信息融合基礎(chǔ)上發(fā)展起來的一個新的融合概念,根據(jù)美國JDL 提出的信息融合四級模型[3],知識融合主要屬于三級、四級高層信息融合的一個范疇,知識融合處理的對象不局限于傳感器獲取的數(shù)據(jù)、信息,還可拓廣到方法、經(jīng)驗甚至思想等,解決了語法和語義級的異構(gòu),實現(xiàn)了分布式知識庫環(huán)境中知識系統(tǒng)的知識重用、知識共享、交互、集成和協(xié)同工作,特別對研究基于知識內(nèi)涵的隱性知識到顯性知識的轉(zhuǎn)變等方面具有相當(dāng)重要的意義。
目前相關(guān)研究領(lǐng)域的文獻中對于知識融合的定義尚未統(tǒng)一,從知識科學(xué)本身研究和應(yīng)用對象的角度出發(fā)基本上可以歸納為兩類:第一類定義以KRAFT 項目的相關(guān)文獻為代表[5~7],該定義認(rèn)為知識融合是指從眾多分布式異構(gòu)的網(wǎng)絡(luò)資源中搜索和抽取相關(guān)知識,并轉(zhuǎn)換為統(tǒng)一的知識模式,從而為某一領(lǐng)域的問題求解構(gòu)造有效的知識資源。
文獻[5]定義知識融合的典型系統(tǒng)KRAFT 從概念層次上對應(yīng)一個域,主要包含三類功能對象實體,分別用W、F 和M 表示,數(shù)據(jù)庫和知識庫都是服務(wù)資源,而用戶Agent 是消費者,如圖1 所示,其中KR 代表知識資源對象,UA 代表用戶Agent。W 的對象實體是服務(wù)對象和資源之間的接口,F(xiàn) 的實體負(fù)責(zé)系統(tǒng)內(nèi)部的消息路由,而M 則是知識融合的核心功能對象,對應(yīng)的對象實體功能包括異構(gòu)數(shù)據(jù)源集成、根據(jù)語義對知識進行轉(zhuǎn)換、知識一致性的檢查和處理、基于本體的知識等價轉(zhuǎn)換等。在實際處理過程中,F(xiàn) 根據(jù)W(可能對應(yīng)服務(wù)資源,也可能對應(yīng)用戶Agent)提供的信息找到適合的M 并建立路由并可在M 之間建立路由。當(dāng)路由是從資源對應(yīng)的W 到M 時,M 執(zhí)行知識轉(zhuǎn)換;當(dāng)一條路徑上有多個M,或者同一M 位于多條路徑上時,就會進行知識融合。當(dāng)路由是從用戶Agent 對應(yīng)的W 到M 時,M以統(tǒng)一模式的方式將另一端知識資源提供給該消費者。從上述過程可以看到,這種體系結(jié)構(gòu)支持的知識融合過程的關(guān)鍵就在于將抽取的知識轉(zhuǎn)換為統(tǒng)一的知識模式,從而為具體的應(yīng)用服務(wù),融合過程從本質(zhì)上對應(yīng)為知識模式的不斷集成和轉(zhuǎn)換[4]。
圖1 KRAFT 概念層次體系結(jié)構(gòu)
第二類定義強調(diào)集成過程的結(jié)果是新知識的產(chǎn)生,認(rèn)為知識融合是一種服務(wù),它通過對來自分布式信息源的多種信息進行轉(zhuǎn)換、集成和合并等處理,產(chǎn)生新的集成化知識對象,同時可以對相關(guān)的信息和知識進行管理[8,9]。
這種定義對應(yīng)的典型系統(tǒng)將知識融合系統(tǒng)分為四個主要功能模塊,問題分析、本體管理、知識融合和知識同步,如圖2 所示。問題分析模塊負(fù)責(zé)將需要求解的問題進行分析和分解,該模塊中需要用到全局本體庫和映射目錄表;本體管理模塊處理領(lǐng)域本體之間的交互性操作,各領(lǐng)域本體間語義交互關(guān)聯(lián)關(guān)系通過由該模塊維護的映射目錄表來體現(xiàn);知識融合是該系統(tǒng)的核心模塊,按照融合規(guī)則集中的條目內(nèi)容和待解問題對應(yīng)的本體對象,將眾多分布式異構(gòu)信息融合為新的集成化知識對象;知識同步模塊會在知識源出現(xiàn)知識融合引起的知識元素變化時,對用戶服務(wù)端的相應(yīng)知識元素進行同步更新以保證用戶端知識對象的一致性。
圖2 第二類定義對應(yīng)的體系結(jié)構(gòu)
現(xiàn)代戰(zhàn)爭形態(tài)正從機械化向信息化轉(zhuǎn)變,其主要特征是全縱深作戰(zhàn)、非線性作戰(zhàn)、非接觸作戰(zhàn)及平時和戰(zhàn)時一直都在進行的以網(wǎng)絡(luò)、信息為基礎(chǔ)的電子信息攻防作戰(zhàn),這種交戰(zhàn)方式不再局限于一定區(qū)域的有限范圍,而是擴大到了全球范圍的陸、海、空、天、電、網(wǎng)等全維空間,信息化戰(zhàn)爭將成為21 世紀(jì)的主要戰(zhàn)爭形勢。為了奪取未來戰(zhàn)爭的信息優(yōu)勢而提出了網(wǎng)絡(luò)中心戰(zhàn)概念,即通過全球信息柵格(GIG)把全譜戰(zhàn)斗空間中許多知識豐富的實體有效地連接起來,真正地實現(xiàn)信息共享和資源共享。為了將多種傳感器和不同的信息源等實體進行更有效的集成,以提高信息處理的自動化程度,從20 世紀(jì)70 年代起,信息融合迅速發(fā)展起來,并在現(xiàn)代C4IKSR 系統(tǒng)中和各武器平臺上得到了廣泛應(yīng)用。
從軍事應(yīng)用的領(lǐng)域出發(fā),知識融合可以歸類為信息融合中高層融合的范疇[10],作為解決態(tài)勢評估及決策系統(tǒng)問題有效的技術(shù)方法。文獻[10]將知識融合定義為,知識融合就是實時地融合和處理大量的來自民用和軍事資源的信息來輔助人們知識創(chuàng)造的過程。美國JDL 將信息融合分為四級模型,現(xiàn)在信息融合的一級、二級融合技術(shù)發(fā)展很快,很好地解決了數(shù)據(jù)冗余、沖突和矛盾信息融合[11~14]的問題,在多傳感器多目標(biāo)跟蹤[15,16]、識別[17~20]和航跡關(guān)聯(lián)[21,22]等應(yīng)用中發(fā)揮了巨大的作用,但是高層的融合即知識層的融合仍面臨巨大的困難。如何解決信息融合高層融合面臨的知識系統(tǒng)語法、語義的異構(gòu)問題,如何實現(xiàn)知識的重用、共享,如何實時的處理大規(guī)模的知識求解,如何融合不同系統(tǒng)傳來的數(shù)據(jù)和信息,以及知識形成統(tǒng)一的戰(zhàn)場態(tài)勢圖都是知識融合所面臨的問題。而近年來美軍在知識融合領(lǐng)域的發(fā)展很快,因為知識融合不僅建立在信息融合的基礎(chǔ)之上,還得益于在多Agent 系統(tǒng)、信息集成和語義網(wǎng)等領(lǐng)域的快速發(fā)展。美軍認(rèn)為知識融合的技術(shù)包含了數(shù)據(jù)融合、信息集成、本體及語義網(wǎng),先進的決策表示及邏輯推理,多知識代理,如圖3 所示。
圖3 軍用領(lǐng)域知識融合的技術(shù)結(jié)構(gòu)
融合算法的目標(biāo)是通過某種可流程化實現(xiàn)的處理過程將已有的知識元素按照約定的規(guī)則進行比較、合并和協(xié)調(diào)等融合運算,從而產(chǎn)生出新的可用知識對象內(nèi)容并同時對原有的知識元素進行優(yōu)化。例如如果有兩個簡單的知識元素分別為KE1和KE2,在它們各自所在的知識領(lǐng)域中并無其他聯(lián)系,但當(dāng)應(yīng)用到某一實際問題PR 時,發(fā)現(xiàn)它們“合成”的新知識元素f(KE1,KE2)確是一個有效的解知識,則可以將規(guī)范化表示后的f(KE1,KE2)作為一個融合結(jié)果加入到原有的知識庫中,同時通過本體概念約束對KE1和KE2進行適當(dāng)?shù)母绿幚?,f 的實現(xiàn)過程就是融合算法的設(shè)計過程。
要實現(xiàn)理想的融合過程需要解決三個基本問題,即知識結(jié)構(gòu)差異性、知識擴展的開放性和知識更新的隨機性。如果知識元素的表示結(jié)構(gòu)存在差異,則很難直接進行處理,從算法結(jié)構(gòu)來看,至少要求輸入是可處理的規(guī)格化數(shù)據(jù)集合。為了解決知識異構(gòu)的問題,現(xiàn)階段研究大都采用本體論的相關(guān)技術(shù)將知識庫轉(zhuǎn)化為本體庫或知識元集合[4,23,24],將知識元素統(tǒng)一為對象化表示處理,消除了知識對象表示方式上的差異。知識擴展的開放性是指知識元素的結(jié)合可能是兩個對象之間,也可能是多個對象之間發(fā)生的,而融合的結(jié)果一般并不是唯一的[25],可能會是一個相當(dāng)龐大的規(guī)模,所以在進行知識融合處理的同時,必須考慮如何對運算后的知識元素規(guī)模進行有效合理的控制。知識更新的隨機性[26]是指知識處理過程中,一個系統(tǒng)的知識應(yīng)該向什么方向演變是無法預(yù)知的,所以很難給出具有特定趨勢指導(dǎo)的融合算法。為此在融合算法中,要盡可能構(gòu)造各種隨機改動的操作,根據(jù)應(yīng)用結(jié)果的反饋來判斷改動的成功與否。
根據(jù)融合過程的動因,可以將融合算法劃分為兩大類,即被動型和主動型。所謂被動型是指融合算法中的啟發(fā)式規(guī)則和適應(yīng)度都是針對具體應(yīng)用求解問題的,這類融合算法本質(zhì)上對應(yīng)于在知識空間進行的搜索算法,即對知識對象演變的趨勢有一個以問題求解為主的導(dǎo)向。被動型和具體應(yīng)用結(jié)合比較緊密,融合算法的處理結(jié)果規(guī)模也相對較小,但是可能會忽略一些有潛在作用的新知識元素。而主動型融合算法主要是針對已有知識對象內(nèi)涵之間潛在的聯(lián)系,即直接在現(xiàn)有知識的基礎(chǔ)上按照知識對象的概念化約束條件生成新知識,這一生成過程并不直接以具體應(yīng)用求解為驅(qū)動或者并不以此為主要目標(biāo),但其結(jié)果可能恰好滿足某種需求(直接或間接)。從算法設(shè)計目標(biāo)上來看,主動型融合是一種構(gòu)造型算法,此類算法的運算規(guī)模要比被動型大,但是能夠較好地兼顧知識的開放性和隨機性。
知識融合是在信息融合基礎(chǔ)上發(fā)展起來的一個新的融合概念,根據(jù)美國JDL 提出的信息融合四級模型[3],知識融合主要屬于三級、四級高層信息融合的一個范疇。知識融合在信息融合中的融合等級模型圖如圖4 所示。
圖4 知識融合的在信息融合中的融合等級模型
知識融合與信息融合的功能目標(biāo)上完全一致,都是通過對多源的對象個體進行綜合分析得到新的可用性強的同類對象。不同之處在于,信息融合的第一級融合處理對象內(nèi)容一般是數(shù)據(jù)化信息,如傳感器信號序列,而信息融合的高層融合即知識融合,不僅需要處理數(shù)據(jù)化的信息,還需處理知識對象實體,例如規(guī)則庫等。
下面介紹一種知識融合的過程模型,該模型主要包括四個功能模塊,如圖5 所示,即本體庫和元知識集的構(gòu)建、融合算法的設(shè)計與實現(xiàn)、解知識空間的生成與演化及基于應(yīng)用反饋的評估與參數(shù)校正;主要包含五種數(shù)據(jù)類型,即代表知識源的知識庫、各知識源對應(yīng)的元知識集合、由對象化表示的本體構(gòu)成的本體庫、用于融合算法過程的融合規(guī)則庫及結(jié)合本體與先驗知識產(chǎn)生的約束集。
圖5 知識融合的過程模型結(jié)構(gòu)圖
從功能模塊的過程化處理角度來看,首先對分布的知識源進行處理,結(jié)合知識融合系統(tǒng)的特點構(gòu)造各領(lǐng)域知識或分布式知識庫對應(yīng)的元知識集和本體;當(dāng)本體管理完成本體映射目錄和全局本體庫之后,融合模塊采用融合算法對規(guī)范化表示的元知識集進行融合處理,結(jié)合本體庫和背景知識產(chǎn)生的約束集構(gòu)建解知識空間:解知識空間中的知識元素按照一定的規(guī)律進行演化,結(jié)合實際應(yīng)用問題在解知識空間中進行搜索,得到需要的(新)知識對象;最后通過知識應(yīng)用的反饋結(jié)果對融合系統(tǒng)的相關(guān)參數(shù)進行優(yōu)化調(diào)整。
知識融合的研究源于知識工程的提出,從1995年起知識融合逐漸成為一個獨立的研究領(lǐng)域,明確地以知識融合為主題的研究項目越來越多,同時在研究過程中采用和涉及到的相關(guān)計算機技術(shù)也隨之增加。
Preece 等[5~7]在KRAFT 項目(knowledge reuse and fusion transformation)的開發(fā)過程中中研究了網(wǎng)絡(luò)環(huán)境下的知識融合,主要包括知識的表達、重用、不確定知識的推理和多Agent 決策。文獻[10]主要研究了知識表達、推理及其在軍事決策上的應(yīng)用,并對大量異構(gòu)信息的智能融合。文獻[27]利用圖劃分技術(shù)提出基于本體的知識融合框架。文獻[28]綜合知識融合過程中軟性約束和硬性約束的特點,提出基于蟻群算法的知識分類技術(shù)。文獻[29]運用OWL 表示概率本體,并提出一個PROWL 概率本體的輸入、存儲和推理的系統(tǒng),實現(xiàn)了多個噪聲信息源的融合。文獻[23]運用網(wǎng)格平臺提出一種基于語義的高效共享和協(xié)同解決問題的方法,實現(xiàn)了智能系統(tǒng)中知識和信息的集成。文獻[30]針對XML數(shù)據(jù)提出了一個知識融合的模型及信息集成框架。文獻[24]研究了基于本體的遺傳融合算法,并建立了系統(tǒng)評估和參數(shù)校正的自適應(yīng)機制。文獻[31]將信息熵的概念引入到基礎(chǔ)概率分配的確定中,推導(dǎo)出基于D-S 證據(jù)組合理論的知識融合公式,并將其應(yīng)用于企業(yè)失敗預(yù)警問題中。文獻[32]為了提高融合知識的語義規(guī)范性和準(zhǔn)確性,提出了利用融合知識測度提高新知識語義內(nèi)涵和控制融合結(jié)果規(guī)模,并運用基于信息擴散原理的評價機制提高融合知識準(zhǔn)確性的知識融合框架。
近年來,知識融合已經(jīng)在國內(nèi)外相關(guān)研究和應(yīng)用領(lǐng)域中發(fā)揮出越來越重要的作用,針對知識融合中的一些關(guān)鍵性問題也有很多新的算法思想和技術(shù)手段不斷被提出和改進,但知識融合的研究過程仍存在一些問題,主要體現(xiàn)在以下幾個方面。
(1)目前的研究一般都會選擇具體的領(lǐng)域知識背景,尚未能夠形成通用性較強的統(tǒng)一的融合框架,如何確立知識融合應(yīng)該必備的功能模塊,如何對各確定模塊之間進行關(guān)系劃分等問題還沒有得到很好地解決,如何確立通用性的知識融合體系結(jié)構(gòu),今后還需要進一步地研究。
(2)可以直接使用的流程化的合理高效的融合算法較少。目前較為典型和普遍的做法是采用定義融合規(guī)則的方式和基于人工神經(jīng)網(wǎng)絡(luò)或遺傳算法原理的流程化算法,但總體來說,這類算法的數(shù)量較少,以至于很難在效率上進行要求或比較。將現(xiàn)階段在人工智能領(lǐng)域中取得很好成果的智能算法應(yīng)用于知識融合領(lǐng)域并提出新的高效算法,將會對知識融合研究的發(fā)展有很大幫助。
(3)大多數(shù)融合算法需要借助于本體之間的交互操作,而本體本身的復(fù)雜性降低了算法的效率。本體的管理過程相對比較復(fù)雜,有一些實現(xiàn)問題還沒有完全得到解決,影響了融合算法的效率。如何盡可能地利用本體論技術(shù)的優(yōu)勢為知識融合服務(wù),又克服本體論技術(shù)中固有的難點對知識融合的影響是今后亟需解決的問題。
(4)由于知識融合的結(jié)果往往是一個規(guī)模龐大的知識集,而其中有些知識是無用的,甚至是不符合邏輯的,所以在融合規(guī)則指導(dǎo)下的知識融合,其產(chǎn)生的新知識的有效性還需進一步通過評價機制予以提高,如何描述和控制融合后新知識的規(guī)模成為一個重要問題。
(5)目前知識融合領(lǐng)域的研究工作相對偏重于概念建模和理論分析,與實際應(yīng)用背景的結(jié)合研究方面還有較大的空間,仍可以開展更多的相關(guān)工作。
[1]CHANG G,ZRIDA J,BRIDWELL J D.Knowledge-Based Distribution System Analysis and Reconfiguration[J]. IEEE Transactions on Power Systems,1990,5(3):744-749.
[2]DENG Y,SHI W K.Experts’Knowledge Fusion in Model—Based Diagnosis Based on Bayes Networks[J]. Journal of Systems Engineering and Electronics,2003,14(2):25-30.
[3]何友,王國宏,關(guān)欣,等. 信息融合理論及應(yīng)用[M].北京:電子工業(yè)出版社,2010.
[4]緱錦. 知識融合中若干關(guān)鍵技術(shù)研究[D]. 杭州:浙江大學(xué),2005.
[5]PREECE A D,HUI K Y,GRAY W A,et al. Designing for Scalability in a Knowledge Fusion System[J]. Knowledge Based Systems,2001,14(3-4):173-179.
[6]PREECE A D,HUI K Y,GRAY W A,et al.KRAFT:An Agent Architecture for Knowledge Fusion[J].Int.Journal of Cooperative Information Systems,2001,10(1-2):171-195.
[7]PREECE A D,HUI K Y,GRAY W A,et al. The KRAFT Architecture for Knowledge Fusion and Transformation[J].Knowledge Based Systems,2000,13(2-3):113-120.
[8]BRAIN J G,DICKSON L. Knowledge Fusion[C]//In:Proc. of the 7th Annual Workshop on Conceptual Structures:Theory and Implementation. Springer-Verlag Published,1992:158-167.
[9]GRAY A,MARTI P. Towards a Scalable Architecture for Knowledge Fusion[C]//In:Proc. of Int. Workshop on Infrastructure for Scalable Multi-Agent Systems. Barcelona,2000:279-292.
[10]SCHERL R,ULERY D L.Technologies for Army Knowledge Fusion[R]. Aberdeen:Army Research Laboratory,2004.
[11]HE YOU,HU LIFANG,GUAN XIN,et al. New Method for Measuring the Degree of Conflict among General Basic Probability Assignments[J]. Science China-information Sciences,2012,55(2):312-321.
[12]HU LIFANG,HE YOU,GUAN XIN,et al.A New Probabilistic Transformation in Generalized Power Space[J].Chinese Journal of Aeronautics,2011,24(4):449-460.
[13]HE YOU,HU LIFANG,GUAN XIN,et al. New Method for Measuring the Degree of Conflict among General Basic Probability Assignments[J]. Science China-Information Sciences,2012,55(2):312-321.
[14] HU LIFANG,GUAN XIN,HE YOU. Efficient Combination Rule of Dezert-Smarandache Theory[J]. Journal of Systems Engineering and Electronics,2008,19(6):1139-1144.
[15]GUAN XIN,HE YOU,YI XIAO. Gray Track-To-Track Correlation Algorithm for Distributed Multitarget Tracking System[J].Signal Processing,2006,86(11):3448-3455.
[16]YI XIAO,GUAN XIN,HE YOU. Dynamic Multidimensional Assignment Algorithm for Multisensor Information Fusion System. Intelligent Control and Automation[J].Book Series:Lecture Notes in Control and Information Sciences,2006,344:869-874.
[17]GUAN XIN,YI XIAO,HE YOU. A Novel Emitter Signal Recognition Model Based on Rough Set. Intelligent Computing in Signal Processing and Pattern Recognition[J]. Book Series:Lecture Notes in Control and Information Sciences,2006,345:81-89.
[18] GUAN XIN,HE YOU,YI XIAO. A Novel Radar Emitter Recognition Algorithm Based on Fuzzy Comprehensive Evaluation[J]. The Proceeding of the International Computer Congress 2004 on Active Media Technology,Chongqing,2004:228-233.
[19]何友,關(guān)欣,衣曉. 基于屬性測度的輻射源識別方法研究[J].中國科學(xué)E 輯,2004,34(12):1329-1336.
[20]關(guān) 欣,何友,衣曉.一種新的基于粗集的輻射源信號識別模型[J]. 宇航學(xué)報,2007,28(3):685-688.
[21]田寶國,何友,楊日杰.人工神經(jīng)網(wǎng)絡(luò)在航跡關(guān)聯(lián)中的應(yīng)用研究[J].電子與信息學(xué)報,2005,27(2),310-313.
[22]何友,田寶國. 基于神經(jīng)網(wǎng)絡(luò)的廣義經(jīng)典分配航跡關(guān)聯(lián)算法[J].航空學(xué)報,2004,25(3):300-303.
[23]ZHENG X Q,WU Z H,CHEN H J. Knowledge Fusion in Semantic Grid[C]//Proceedings of the 5th International Conference on Grid and Cooperative Computing,Changsha,2006:424-431.
[24]緱錦,楊建剛,蔣云良,等. 基于元信息和本體論的知識融合算法[J]. 計算機輔助設(shè)計與圖形學(xué)學(xué)報,2006,18(6):819-823.
[25] ERIC GREGOIRE. Fusing Legal Knowledge[C]//In:Proc.of the 14th IEEE int.Conf on Information Reuse and Integration.Les Vegas,2004:522-529.
[26]STUART RUSSELL,PETER NORVIG. Artificial Intelligence[M]. 北京:人民郵電出版社,2010.
[27]KUO T T,TSENG S S,LIN Y T. Ontology Based Knowledge Fusion Framework Using Graph Partitioning[M].Heidelberg:Springer,2003,2718:11-20.
[28]MARTENS D,BAEKER M D ,HAESEN R,et al. Ant-Based Approach to the Knowledge Fusion[M]. Heidelberg:Springer,2006,4150:84-95.
[29]LASKEY K B,COSTA P C G,JANSSEN T. Probabilistic Ontologies for Knowledge Fusion[C]//Proceedings of the 11th International Conference on Information Fusion,Cologne,2008:1-8.
[30]XIE N F,CAO C G,GUO H Y.A Knowledge Fusion Model for Web Information[C]//Proceedings of IEEE/WIC/ACM International Conference on Web Intelligence,Compiegne Cedex,2005:67-72.
[31]韓立巖,周芳.基于D-S 證據(jù)理論的知識融合及其應(yīng)用[J].北京航空航天大學(xué)學(xué)報,2006,32(1):65-68,73.
[32]徐賜軍,李愛平,劉雪梅. 基于本體的知識融合框架[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2010,20(7):1230-1236.