渠寒花,惠建忠,何險峰,王慕華,何曉鳳,豐德恩
QU Hanhua1,HUI Jianzhong1,HE Xianfeng2,WANG Muhua1,HE Xiaofeng1,FENG De’en1
1.中國氣象局 公共氣象服務(wù)中心,北京 100081
2.四川省農(nóng)村經(jīng)濟綜合信息中心,成都 610072
1.Public Meteorological Service Center,China MeteorologicalAdministration,Beijing 100081,China
2.Rural Economic Information Center of Sichuan,Chengdu 610072,China
氣象科學(xué)技術(shù)以氣象知識造福人民為最終目的[1],并通過服務(wù)體現(xiàn)價值。氣象服務(wù)本質(zhì)是氣象知識的服務(wù),氣象服務(wù)知識的發(fā)現(xiàn)、傳播和共享為更好開展氣象服務(wù)奠定了基石。在氣象服務(wù)領(lǐng)域中,領(lǐng)域概念及其關(guān)系構(gòu)成了氣象服務(wù)知識的主體,通常以指標(biāo)、規(guī)則的方式,描述氣象服務(wù)對象和氣象定量要素間的關(guān)系??陀^化、規(guī)范的知識獲取和表示方法是氣象服務(wù)知識傳播和共享的有效途徑。W3C發(fā)布的網(wǎng)絡(luò)本體語言O(shè)WL(Web Ontology Language)[2-3],為網(wǎng)絡(luò)知識語義層次的共享和互操作提供了標(biāo)準(zhǔn)和規(guī)范。隨著知識表示與專業(yè)氣象服務(wù)不斷深入,概念間存在的冗余邏輯關(guān)系、隱含關(guān)系難以直接在本體層發(fā)現(xiàn)和表述。因此,分析特定氣象服務(wù)領(lǐng)域背景下概念結(jié)構(gòu)的構(gòu)成,對指標(biāo)、規(guī)則進行重組優(yōu)化,為建立更加簡潔本體知識庫提供科學(xué)依據(jù),成為不可或缺的重要步驟。形式概念分析以數(shù)學(xué)思維方式進行概念分析,理所當(dāng)然成為氣象服務(wù)概念處理的理論基礎(chǔ)。
形式概念分析(Formal Concept Analysis,F(xiàn)CA)是抽象代數(shù)的一個分支,由Wille教授在1982年[4]提出,用于概念的形式分析、發(fā)現(xiàn)和排序。在形式概念分析中,概念是概念外延和概念內(nèi)涵的抽象。外延是父概念所包含子概念對象的集合;內(nèi)涵是概念對象特征或?qū)傩缘募蟍5]。外延和內(nèi)涵的關(guān)系通過概念格,以Hasse圖方式描述概念間的偏序關(guān)系結(jié)構(gòu)[6]。目前,形式概念分析作為一種重要的離散數(shù)據(jù)分析和知識獲取方法,廣泛應(yīng)用于機器學(xué)習(xí)、信息檢索、軟件工程等領(lǐng)域[7]。但是,使用形式概念分析指導(dǎo)氣象服務(wù)知識處理尚處于起步階段。何險峰等人雖然基于數(shù)理統(tǒng)計和邏輯學(xué),實現(xiàn)了氣象服務(wù)領(lǐng)域災(zāi)害本體設(shè)計和應(yīng)用[8-9],但未能實現(xiàn)本體模型與形式邏輯理論的有效統(tǒng)一,也尚未獲得適用于氣象服務(wù)領(lǐng)域的統(tǒng)一解決方案。智慧來等深入研究了形式概念分析中的對象概念與屬性概念[10];毛華等提出了一種等價關(guān)系約束屬性形式概念分析方法[11];張斌等基于形式概念分析與統(tǒng)計理論,構(gòu)建本體模型[12],為氣象服務(wù)領(lǐng)域基于形式概念分析,進行知識發(fā)現(xiàn)和表示提供了理論基礎(chǔ);文獻[10-11]僅從FCA理論角度出發(fā),解決了概念格構(gòu)建及其關(guān)系優(yōu)化算法,未能結(jié)合具體的服務(wù)領(lǐng)域,獲得切實可用的形式概念分析本體知識庫并開展服務(wù)應(yīng)用;文獻[12]雖然結(jié)合政務(wù)領(lǐng)域,提出基于統(tǒng)計理論的概念格造格算法,但未能結(jié)合描述邏輯規(guī)范,實現(xiàn)從數(shù)據(jù)到知識的本體構(gòu)建和智能推理應(yīng)用。
本文從氣象服務(wù)多值形式背景出發(fā),研究通過數(shù)理邏輯、OWL2語法規(guī)范和本體知識庫實現(xiàn)領(lǐng)域概念關(guān)系的可視化表達(dá),構(gòu)建了符合本體知識庫管理需求的氣象服務(wù)形式概念分析一般模型。提出了基于一階謂詞表達(dá)多值背景屬性,應(yīng)用布爾代數(shù)范式表達(dá)復(fù)雜命題,實現(xiàn)氣象領(lǐng)域數(shù)據(jù)向知識轉(zhuǎn)化應(yīng)用,為領(lǐng)域隱含概念關(guān)系知識發(fā)現(xiàn)和表示提供了更為理想的解決方案。
定義1(形式背景)三元組K=(G,M,I),其中,G是對象集合,M 是屬性集合(Attributes),I?G×M 是G與M 之間的一個二元關(guān)系(Incidence),gIm表示概念g受屬性m的影響,通過謂詞邏輯作用。
定義2(概念的內(nèi)涵和外延)形式背景K=(G,M),上的一個形式概念(簡稱概念)定義為一個二元組(A,B),滿足:A?G ,B?M ,A′=B,B′=A,其中,A稱為概念(A,B)的外延,B稱為概念(A,B)的內(nèi)涵。
定義3(概念格)(A,B)和(C,D)是形式背景K=(G,M,I)上的任何兩個概念,稱(A,B)是(C,D)的超概念(等價的,(C,D)為(A,B)的子概念),當(dāng)且僅當(dāng)B?D(等價的,C?A),記為(C,D)≤(A,B)。即:(C,D)≤(A,B)?B?D(?C?A),通過這種序關(guān)系,得到一個有序集B(K)=(B(K),≤),稱為形式背景K的概念格。
具有以下性質(zhì):
(1)等冪(idempotent):A″″=A″
(2)單調(diào)(monotonic):A1?A2→A1″?A2″
(3)延展(extensive):A?A″
定義4(偏序集)設(shè)L為一集合,x,y,z∈L.L上的一個二元關(guān)系F,且滿足自反性、反對稱性和傳遞性,稱為偏序,具有偏序關(guān)系F的集合L稱為偏序集,記為(L,F)。
定義5(全序集)設(shè)(A,≤)是一個偏序集,≤是其偏序關(guān)系。若對于任意的元素x,y∈A,都有x≤y或y≤x成立,即x和y是可比的,則稱≤為一個全序關(guān)系,(A,≤)為全序集。
定義6(哈塞圖)設(shè)(S,≤)是偏序集,圖(V,E)稱為(S,≤)的哈塞圖。這里S=V,E={(x,y)|x∈V,y∈V,x≤y},x是y的下鄰近。
定義7(上鄰近、下鄰近) x稱為 y的下鄰近,當(dāng)x<y,且沒有z滿足x<z<y,這時也稱y是x的上近鄰,并且記做x≤y。在概念格中,一個概念的下近鄰是它的子概念,一個概念的上近鄰是它的父概念。
如圖1所示給出了由形式背景、概念格、本體知識庫、知識庫應(yīng)用組成的形式概念分析模型。該模型從縱向看,闡述了在形式概念分析下,由形式背景分析、概念格構(gòu)造、知識庫構(gòu)建,并進行應(yīng)用的理論研究;從橫向看,討論了以知識代理為中心,實現(xiàn)氣象觀測數(shù)據(jù)經(jīng)過推理得到氣象服務(wù)知識,并進行應(yīng)用的實踐過程。該結(jié)構(gòu)模型的物理意義可表示為:
(1)形式背景。是形式概念分析的起點,也是通過謂詞化定義多值背景屬性并轉(zhuǎn)換為單值形式背景,進而表達(dá)氣象服務(wù)領(lǐng)域內(nèi)涵和外延的過程。分解后的單值形式背景,其內(nèi)涵是氣象服務(wù)領(lǐng)域中基礎(chǔ)氣象影響因子集合,外延是概念等級尺度上的全序集合,形成了一套便于概念格邏輯分析基礎(chǔ),構(gòu)成了概念格概念結(jié)構(gòu)的主體。
(2)概念格。將形式背景階段獲取的氣象服務(wù)概念和關(guān)系用概念集合表示,也是形式概念分析理論的核心數(shù)據(jù)結(jié)構(gòu)。描述了領(lǐng)域概念間的層次關(guān)系,通過Hasse圖的形式表現(xiàn)氣象服務(wù)概念內(nèi)涵和外延在序集上的分級關(guān)系,為氣象服務(wù)形式概念模型向本體知識庫映射,利用描述邏輯表達(dá)概念相關(guān)性提供了方法。
圖1 氣象服務(wù)形式概念分析模型
(3)本體知識庫。將概念格中已經(jīng)獲取的對象和關(guān)系,應(yīng)用OWL2描述邏輯規(guī)范和布爾代數(shù)表達(dá)式進行等價關(guān)系描述,也是其利用開源軟件進行工程化的過程。這一步驟,為氣象服務(wù)領(lǐng)域?qū)ο蠛完P(guān)系向本體知識轉(zhuǎn)換、氣象觀測數(shù)據(jù)向氣象服務(wù)知識轉(zhuǎn)換,和知識庫智能代理應(yīng)用提供了知識基礎(chǔ)。
(4)知識庫應(yīng)用。是開展形式概念分析和本體知識庫設(shè)計的最終落腳點。由觀測數(shù)據(jù)庫、智能代理和知識應(yīng)用的信息服務(wù)系統(tǒng)構(gòu)成。通過Jena語義推理和網(wǎng)絡(luò)傳輸手段,對形成的氣象服務(wù)本體文件分析處理,將實時觀測數(shù)據(jù)通過智能代理轉(zhuǎn)化為氣象服務(wù)知識,并結(jié)合特定服務(wù)領(lǐng)域需求進行氣象服務(wù)應(yīng)用。
根據(jù)模型頂層設(shè)計,將氣象服務(wù)形式概念模型設(shè)計分為氣象服務(wù)多值背景分析、概念的布爾代數(shù)范式表示和概念符號化三個層次,每部分工作基于上一環(huán)節(jié)展開,因此也是氣象服務(wù)從形式概念形式背景分析到本體知識庫應(yīng)用的過程設(shè)計。
氣象服務(wù)形式概念分析從形式背景開始。氣象服務(wù)知識由概念和概念間的關(guān)系構(gòu)成,表現(xiàn)為基礎(chǔ)氣象觀測因子與指標(biāo)、規(guī)則及屬性值間的關(guān)系。對象-屬性-值關(guān)系是一種對現(xiàn)實問題解析的數(shù)據(jù)結(jié)構(gòu),在形式概念分析中被定義為多值背景[13]。
定義8(多值背景)一個多值背景(G,M,W,I),其中G是對象集,M是多值屬性集,W是屬性值的集合,I是它們之間的三元關(guān)系,I?G×M×W,使得對任意 g∈G,m∈M ,最多只有一個值w∈W 滿足(g,m,w)∈I,即(g,m,w)∈I和 (g,m,v)∈I總蘊含有w=v,表明相同的對象的同一個屬性項的值應(yīng)該相等;用(g,m,w)∈I,表示“對于屬性m,對象g具有屬性值w”。
形式背景描述了內(nèi)涵和外延的二元關(guān)系,而多值背景的屬性具有多值特征,需要根據(jù)合適的領(lǐng)域意義和知識將其向形式背景分析和轉(zhuǎn)換,這就需要首先通過形式概念分析去厘清氣象服務(wù)領(lǐng)域中概念關(guān)系,進而實現(xiàn)概念格構(gòu)建和本體知識表達(dá)。形式化方法能有效避免二義性和語義不完整,為多值屬性關(guān)系的多值屬性提取、定義和轉(zhuǎn)換[14]提供了思路。因此,以基于一階謂詞定義的多值背景屬性為基礎(chǔ),建立氣象服務(wù)領(lǐng)域關(guān)系外延、內(nèi)涵與基本氣象因子、時間、地域等要素之間的三元關(guān)系,以實現(xiàn)多值背景轉(zhuǎn)換分解和領(lǐng)域本體知識描述的目標(biāo)。
一階謂詞表示以分段函數(shù)和命題函數(shù)定義和應(yīng)用為出發(fā)點。在氣象服務(wù)關(guān)系定義中,分段函數(shù)表示為基礎(chǔ)氣象因子與時間變量關(guān)系的數(shù)學(xué)模型。如氣象災(zāi)害中暴雨與降水量、臺風(fēng)與風(fēng)速等存在分段函數(shù)關(guān)系。
定義9(分段函數(shù))設(shè)x是氣象觀測要素,如降水量、溫度、能見度等數(shù)據(jù),x∈[x1,x2]表示為全序集(zi,≤)時間范圍內(nèi)氣象因子的分段函數(shù)zi:
一階邏輯是人工智能中較常用的知識表達(dá)方法,用謂詞和量詞表示,提供了良好的階段推理和決策效率。由表1給出的概念定義,可以看出氣象因子與概念間存在分段函數(shù)和一階邏輯的聯(lián)系。
定義10(一階邏輯)設(shè)x是時間尺度、空間尺度范圍內(nèi)的氣象因子,p(x)是氣象因子x的命題函數(shù),對分段梯度函數(shù)的全序集(zi,≤),zi的一階邏輯表示為:
表1 以一階邏輯定義多值背景屬性舉例
氣象服務(wù)本身就是一個個復(fù)雜的命題邏輯,其概念外延是多個概念內(nèi)涵共同作用的結(jié)果。基于謂詞和量詞的概念定義和應(yīng)用(如表1),能更深刻地刻畫氣象服務(wù)的基本概念。在使用OWL2規(guī)范構(gòu)造本體知識庫時,當(dāng)簡單命題無法表達(dá)氣象服務(wù)復(fù)雜概念時,基于組合邏輯運算關(guān)系的布爾代數(shù)合取范式及德摩根律,成為解決復(fù)雜關(guān)系表達(dá)的重要方法。
例1以氣象電力服務(wù)中的風(fēng)偏紅色預(yù)警災(zāi)害為例,表示為降水量、變溫、變濕等多個氣象因子一階邏輯定義和復(fù)合命題描述。
x:地面小時降水量
t1:1小時變溫
t2:2小時變溫
rh1:1小時變濕
rh2:2小時變濕
復(fù)合命題中包括了謂詞邏輯和布爾運算多種邏輯關(guān)系,表達(dá)關(guān)系較為混雜,出現(xiàn)問題后較難查找癥結(jié),將復(fù)合命題逐層分解,可獲得基于一階邏輯和布爾代數(shù)范式表示。其中,一階謂詞邏輯屬性定義和正確性驗證在描述邏輯的屬性定義中,而不在范式中進行,最大程度提升范式推理效率。對于較為復(fù)雜的氣象服務(wù)概念表示,本方法尤為有效。
合取范式表達(dá)為多個命題的數(shù)理邏輯運算,在復(fù)雜概念情況下,可表示為多個氣象因子共同作用的因果關(guān)系,能獲得較高的推理效率,而德摩根定律能實現(xiàn)具體情境下,析取范式向合取范式的轉(zhuǎn)化。
定義11(合取范式)設(shè)A是一個謂詞邏輯公式,A中出現(xiàn)的命題變元為p1,p2,…,pn,以Qi表示pi或┐pi,i=1,2,…,n。稱 Q1∧Q2∧…∧Qn是 p1,p2,…,pn的一個合取項,若干個互不相同的析取項的合取稱為一個合取范式,與命題公式A邏輯等價的合取范式稱為A的合取范式。
定義12(德摩根律)在命題邏輯和邏輯代數(shù)中,德·摩根定律是關(guān)于命題邏輯規(guī)律的一對法則。在命題邏輯中存在著下面這些關(guān)系:
根據(jù)德摩根律,例1改進為:風(fēng)偏紅色預(yù)警≡P(x)∧P(t1)∧(?P(t2))∧P(rh1)∧(?P(rh2))。
結(jié)合數(shù)理邏輯中的一階謂詞,實現(xiàn)了氣象服務(wù)領(lǐng)域多值背景向形式背景的轉(zhuǎn)換,而布爾代數(shù)合取范式和德摩根律,為氣象服務(wù)形式背景中概念和外延的表示,提供了有效的形式語言表示方法,為氣象服務(wù)形式概念分析和本體知識表達(dá)提供了數(shù)學(xué)基礎(chǔ)。
有效的符號標(biāo)識能促進氣象服務(wù)領(lǐng)域知識傳播和共享。對本體結(jié)構(gòu)ontology=<C,O,D,E,A>中的類、數(shù)據(jù)屬性、對象屬性、邏輯等價類和公理進行符號化約束,形成了氣象服務(wù)形式概念分析的簡明表達(dá),將有助于類等價關(guān)系表達(dá)和DL Query推理。符號化主要包括如下三方面:(1)對描述邏輯中的基本屬性、類和個體,使用有語義聯(lián)系的命名作為主體,而非漢語詞匯。(2)數(shù)據(jù)屬性是連接本體和智能代理的中間數(shù)據(jù)定義。采用在氣象服務(wù)領(lǐng)域廣泛認(rèn)可、無歧義的術(shù)語,推薦使用同一英文命名,便于數(shù)據(jù)資源統(tǒng)一獲取和應(yīng)用,無需重復(fù)定義。(3)同一本體模型內(nèi)定義的概念、數(shù)據(jù)屬性、對象屬性、基本屬性命名唯一,避免二義性帶來的推理悖論。
由于氣象服務(wù)覆蓋領(lǐng)域廣,信息資源龐大,尤其是與氣象服務(wù)密切相關(guān)的專業(yè)服務(wù)領(lǐng)域,交通、電力、水文等,具有形式背景復(fù)雜和實用性強的特點。為了提高知識獲取和表示質(zhì)量和效率,以第4章形式概念模型構(gòu)建方法為基礎(chǔ),從公路交通氣象服務(wù)和電力氣象服務(wù)需求出發(fā),給出氣象服務(wù)形式概念模型下從形式背景分析、概念格生成到本體知識庫構(gòu)建和應(yīng)用的過程。
5.1.1 公路交通氣象服務(wù)形式背景分析
公路交通出行受到多個基礎(chǔ)氣象要素的影響和制約,研究不同氣象要素對公路交通出行的綜合影響,對更好地開展氣象服務(wù)意義重大。國家級氣象服務(wù)部門綜合研究分析天氣、能見度、風(fēng)力等多個高影響天氣要素對公路交通出行的影響,建立了公路通行的氣象條件模型[15]?;诖四P?,結(jié)合形式概念分析模型設(shè)計,建立了公路交通氣象形式概念分析形式背景,揭示氣象要素與公路通行條件的相關(guān)性,為公路交通氣象服務(wù)知識庫建模和應(yīng)用提供知識基礎(chǔ)。
表2 公路通行氣象條件模型多值背景二維表
表3 公路通行氣象條件模型形式背景
根據(jù)表2公路通行氣象條件模型多值背景二維表,其中,G={易行,濕滑,危險},為公路通行氣象條件等級全序集,W={陣雨,小雨,中雨,大雨,小雪,中雪,大雪,雨夾雪,輕霧,霧,雷暴,冰雹,沙塵暴,龍卷,吹雪,颮,能見度,風(fēng)速}為高影響氣象要素的屬性集合,W為氣象要素與能見度、風(fēng)力的多值背景屬性集合,I表示為不同級別的公路通行條件與氣象高影響要素不同程度的因果依賴關(guān)系。根據(jù)多值背景轉(zhuǎn)換方法,重新定義后的公路通行氣象條件模型形式背景見表3。
(1)應(yīng)用一階謂詞邏輯定義能見度、風(fēng)力及天氣等不同等級的高影響氣象要素,即概念內(nèi)涵。
(2)使用布爾代數(shù)合取范式表示不同公路通行條件下的概念外延,根據(jù)布爾代數(shù)合取范式規(guī)則,公路通行氣象條件模型的外延可表示為:
易行(1)≡g and r
濕滑(2)≡i and g and r
危險(3)≡c and d and f and g and h and j and k and l and m and n and o and p and g and r
5.1.2 概念格生成
根據(jù)表3形式背景分析后形成的概念格(如圖2),表示了公路交通氣象服務(wù)中不同公路通行條件與高影響氣象要素之間的關(guān)聯(lián)關(guān)系,實現(xiàn)了基于形式概念分析的公路交通氣象服務(wù)知識表示。在分析過程中,使用一階謂詞邏輯表達(dá)概念內(nèi)涵,使用合取范式表示概念外延,為氣象服務(wù)領(lǐng)域知識獲取和本體知識庫構(gòu)建開展了有益的探討。
圖2 公路通行氣象條件模型概念格
5.2.1 電力氣象服務(wù)形式背景分析
根據(jù)收集到的電力氣象災(zāi)害風(fēng)險閾值指標(biāo),借助專家領(lǐng)域知識,定義了電力氣象舞動災(zāi)害多值背景。其中,G={舞動無預(yù)警,舞動藍(lán)色預(yù)警,舞動黃色預(yù)警,舞動橙色預(yù)警,舞動紅色預(yù)警},為電力氣象舞動災(zāi)害預(yù)警等級的全序集,W={地面小時溫度,地面相對濕度,地面小時風(fēng)速,高空溫度露點溫度條件,高空冷暖層條件},為屬性值的集合,W為多值背景屬性集合,三元關(guān)系I表示為不同級別的電力災(zāi)害與基礎(chǔ)氣象要素不同程度依賴的因果依賴關(guān)系。
(1)表4中的地面小時溫度、地面相對濕度、地面小時風(fēng)速,已經(jīng)是最基本的氣象觀測因子,從分段函數(shù)值域出發(fā),在描述邏輯的邏輯等價類中以一階謂詞邏輯定義屬性值。
(2)表4中的多值屬性高空溫度露點溫度條件、高空冷暖層條件,是多個基礎(chǔ)氣象觀測因子經(jīng)自然語言組合和數(shù)學(xué)運算后形成的復(fù)合條件,借助邏輯換算[16]提取多值背景中的有限數(shù)據(jù)進行術(shù)語定義,以一階邏輯對有效數(shù)據(jù)和關(guān)系進行整體定義,其數(shù)學(xué)計算過程不屬于描述邏輯范圍,在此不作過多涉及,可在描述邏輯的數(shù)據(jù)屬性中定義生成。重新定義后的電力氣象服務(wù)多值背景屬性見表5。
表4 電力氣象舞動災(zāi)害多值背景二維表
表5 電力氣象服務(wù)多值背景屬性定義
表6 轉(zhuǎn)換后的電力氣象災(zāi)害舞動災(zāi)害形式背景
5.2.2 概念格生成
Lattice Miner在復(fù)雜問題處理、支持語義網(wǎng)絡(luò)和關(guān)聯(lián)規(guī)則提取方面具有優(yōu)勢,是單值形式背景和多值形式背景之間的相互轉(zhuǎn)換的較好工具。針對較為復(fù)雜的多值形式背景,其通過”ConverttoBinary/Nested Context”,將多值背景轉(zhuǎn)化為單值背景。轉(zhuǎn)換后的形式背景(見表6),多值屬性值作為概念內(nèi)涵,成為參與電力氣象服務(wù)概念格表達(dá)的主體結(jié)構(gòu)。
根據(jù)布爾代數(shù)合取范式規(guī)則,電力氣象服務(wù)舞動災(zāi)害外延表示為:
無舞動預(yù)警≡?RH0 and?WS0 and?HLN0 and?HPT0 and(?T0 and ?T2)
舞動藍(lán)色預(yù)警≡RH1 and T1 and WS1 and HLN1 and HPT1
舞動黃色預(yù)警≡RH2 and T1 and WS1 and HLN1 and HPT1
舞動橙色預(yù)警≡RH3 and T1 and WS1 and HLN1 and HPT1
舞動紅色預(yù)警≡RH4 and T1 and WS1 and HLN1 and HPT1
經(jīng)過形式概念分析后形成的概念格(如圖3),表達(dá)出電力氣象服務(wù)中的舞動災(zāi)害中各概念節(jié)點上鄰近、下鄰近與基本氣象因子之間的關(guān)聯(lián)關(guān)系,實現(xiàn)了基于形式概念分析的電力氣象服務(wù)知識表示。其中,使用一階謂詞邏輯定義多值屬性表達(dá)概念內(nèi)涵,使用布爾表達(dá)式合取范式和德摩根律表示概念外延,實現(xiàn)了不同氣象服務(wù)領(lǐng)域知識獲取、表示和應(yīng)用,證明了模型的通用性。
本文使用Lattice Miner1.4[17]、Protégé5.0[18]工具實現(xiàn)概念格和知識庫構(gòu)建、管理,應(yīng)用OWL API[19]、Jena 2.6(http://jena.apache.org/documentation/ontology/)進 行 智能代理設(shè)計,使得氣象觀測數(shù)據(jù)到氣象服務(wù)知識的智能推理自動化。其中,Protégé5.0實現(xiàn)了氣象服務(wù)領(lǐng)域分類樹圖設(shè)計。以實例電力氣象服務(wù)領(lǐng)域本體構(gòu)建為例,第一層Thing是分類樹的根節(jié)點;第二層是氣象服務(wù)中的電力氣象災(zāi)害類;第三層電力氣象災(zāi)害子類?{風(fēng)偏,污閃,舞動}為概念偏序集;第四層為舞動災(zāi)害屬性類和邏輯等價類設(shè)計(如圖4和圖5所示)。
圖3 電力氣象災(zāi)害舞動災(zāi)害概念格
圖4 形式概念分析下的本體知識庫結(jié)構(gòu)
圖5 使用protégé完成概念屬性定義和等價類設(shè)計
對本體知識庫描述邏輯的先驗測試是避免知識推理矛盾的有效手段,DL Query為邏輯設(shè)計和知識推理的完備性和可靠性檢驗提供了GUI可視化界面。在邏輯測試時,需啟動Hermit(或Fact++)推理機,根據(jù)本體數(shù)據(jù)屬性設(shè)計進行賦值,并依次進行謂詞邏輯和布爾代數(shù)表達(dá)式測試。以電力氣象服務(wù)為例,輸入(RH4 value 93.0f)and(T1 value-2.0f)and(WS1 value 6.0f)and(HLN1 value 1.0f )and(HPT1 value 1.0f),根據(jù)形式背景定義,將會得到“舞動紅色預(yù)警”的推理結(jié)果。同時,利用OWL的開源API的規(guī)則推理機Jena作用下,擴展OWL等價關(guān)系,實現(xiàn)數(shù)學(xué)表達(dá)式、謂詞邏輯、布爾代數(shù)的智能推理過程。
氣象服務(wù)擁有海量的數(shù)據(jù)量和知識量,本文設(shè)計了形式概念分析模型,研究參與氣象服務(wù)中的數(shù)據(jù)和知識間的相互關(guān)系,將氣象服務(wù)本體知識建模的過程分為一階謂詞定義、布爾代數(shù)范式表示和符號化三個層次。一方面,利用數(shù)理邏輯設(shè)計本體建模的形式化,實現(xiàn)了邏輯設(shè)計的本體化表示;另一方面,將氣象服務(wù)中的指標(biāo)體系和概念模型等傳統(tǒng)模型結(jié)構(gòu),應(yīng)用網(wǎng)絡(luò)本體語言O(shè)WL模型進行知識處理,完成了海量氣象數(shù)據(jù)向氣象服務(wù)知識的自動轉(zhuǎn)化過程,使得氣象服務(wù)本體知識庫建模和應(yīng)用自動化、客觀化和科學(xué)化,提升了知識的表達(dá)能力和效率,實現(xiàn)了形式概念知識描述機制在氣象服務(wù)領(lǐng)域中的應(yīng)用。
本文提出區(qū)別于傳統(tǒng)方法的氣象服務(wù)領(lǐng)域知識發(fā)現(xiàn)和表示模型,將形式概念分析理論引入氣象服務(wù)領(lǐng)域進行知識發(fā)現(xiàn),結(jié)合OWL2描述邏輯本體知識庫進行知識表示,有效解決了領(lǐng)域隱含知識難以發(fā)現(xiàn)、知識表示不夠的問題,并在公路交通氣象服務(wù)和電力氣象服務(wù)領(lǐng)域得到了例證。經(jīng)驗證,該方法適用于多個氣象服務(wù)領(lǐng)域背景下的概念知識發(fā)現(xiàn)和表示,具備較好的適應(yīng)和推廣能力,主要體現(xiàn)在:
(1)提出了氣象服務(wù)領(lǐng)域知識獲取和表示的結(jié)構(gòu)化模型。以形式概念分析理論為基礎(chǔ),結(jié)合數(shù)理邏輯,給出了復(fù)雜形式背景轉(zhuǎn)換和表示的有效方法,實現(xiàn)了氣象服務(wù)領(lǐng)域復(fù)雜概念下知識不同維度分解和表示。
(2)結(jié)合OWL2描述規(guī)范,實現(xiàn)氣象服務(wù)知識本體庫構(gòu)建和智能推理應(yīng)用。以具體的氣象服務(wù)領(lǐng)域為例,結(jié)合本體構(gòu)建工具,實現(xiàn)了知識的轉(zhuǎn)化和應(yīng)用過程,獲得了可推廣到氣象服務(wù)領(lǐng)域解決方案,具有實踐指導(dǎo)意義。
基于形式概念分析的知識表達(dá)是一項長期的研究工作。本文的研究尚未涉足在自然語言處理、天氣系統(tǒng)概念描述等方面的應(yīng)用,仍有大量的工作有待完成。
參考文獻:
[1]馬鶴年,沈國權(quán),阮水根,等.氣象服務(wù)學(xué)基礎(chǔ)[M].北京:氣象出版社,2001.
[2]Brockmans S,Colomb R M,Haase P,et al.A model driven approach for building OWL DL and OWL full ontologies[C]//Proceedings of the International Semantic Web Conference,2006:187-200.
[3]丁松,唐勝群,劉坤,等.非一致OWL本體的推理方法研究[J].計算機工程與應(yīng)用,2011,47(9):21-24.
[4]Wille R.Restructuring lattice theory:An approach based on hierarchies of concepts[M]//Ordered Sets.Dordrecht:Springer,1982:445-470.
[5]Fu G.FCA based ontology development for data integration[J].Information Processing and Management,2016,52(5):765-782.
[6]齊紅.基于形式概念分析的知識發(fā)現(xiàn)研究[D].長春:吉林大學(xué),2005:6-24.
[7]He L J,Wang Q T.Construction of ontology information system based on formal concept analysis[J].Advances in Computer Science,Intelligent System and Environment,2011,104:83-88.
[8]何險峰,舒紅平,雷升鍇,等.氣象服務(wù)同構(gòu)模型研究[J].計算機應(yīng)用研究,2014,31(8):2394-2398.
[9]何險峰,雷升鍇,張祥峰,等.本體化氣象服務(wù)實現(xiàn)與應(yīng)用[J].計算機應(yīng)用,2012,32(S2):226-231.
[10]智慧來,智東杰.形式概念分析中的對象概念與屬性概念[J].計算機工程與應(yīng)用,2013,49(18):112-115.
[11]毛華,李斌.等價關(guān)系約束屬性的形式概念分析[J].計算機工程與應(yīng)用,2010,46(36):158-160.
[12]張斌,劉增良,余達(dá)太,等.基于形式概念分析與統(tǒng)計理論的本體構(gòu)建模型[J].計算機應(yīng)用研究,2011,28(1):111-113.
[13]楊麗,宋振明.基于對象間相互作用的形式概念分析[J].計算機工程與應(yīng)用,2006,42(29):33-35.
[14]Prediger S,Stumme G.Theory-driven logical scaling:Conceptual information systems meet description logics[C]//Proceedings of the 6th International Workshop on Knowledge Representation Meets Databases,1999:46-49.
[15]王慕華,唐衛(wèi),渠寒花,等.面向公眾出行的公路交通氣象服務(wù)系統(tǒng)[J].氣象科技,2015,43(5):992-997.
[16]李曉瑞,鐘鋒,余遠(yuǎn),等.基于邏輯換算的一致背景的研究[J].計算機工程與應(yīng)用,2010,46(21):142-144.
[17]WIKIPEDIA.Functional architecture of LatticMiner[EB/OL].(2016-06-25).https://en.wikipedia.org/wiki/Lattice_Miner.
[18]Thomas J.Stanford center for protégé informations[EB/OL].(2013-12-13).https://protegewiki.stanford.edu/wiki/Main_Page.
[19]Hawke S,Herman I.The OWL API[EB/OL].(2012-01-15).https://www.w3.org/2001/sw/wiki/OWL.