/秦皇島供電公司 張屹 李明祥/
CBR在電力信息運維中的應(yīng)用
/秦皇島供電公司 張屹 李明祥/
在信息專業(yè)日常運維工作中,技術(shù)人員在長期的工作實踐中積累了解決各類具有相似性問題的經(jīng)驗,并把這些經(jīng)驗收錄整理。然而由于地域的局限性,信息很難進(jìn)行共享。即使有些運維經(jīng)驗被集中收錄,但在運維經(jīng)驗查詢時,只能按文章標(biāo)題、文章作者等這些信息檢索。而在實際工作中碰到的故障現(xiàn)象往往是屬于描述性的,僅憑這些信息并不能及時找到類似的案例。文章針對現(xiàn)有信息運維典型經(jīng)驗搜索引擎方式進(jìn)行了分析,建立了一套專業(yè)的查詢分析系統(tǒng)以更好地服務(wù)信息運維人員。
電力信息運維;CBR;案例庫;推理
在信息運維日常工作中,公司信息運維技術(shù)人員經(jīng)常會碰到各類問題,如信息網(wǎng)絡(luò)問題、信息系統(tǒng)軟件、硬件故障等,這些問題往往具有類似性;在長期的工作實踐中信息運維技術(shù)人員積累了解決這些問題的經(jīng)驗,并把這些經(jīng)驗收錄整理,但是在實際工作中,碰到的問題現(xiàn)象往往是屬于描述性的,僅憑這些信息并不能及時找到類似的案例來解決相應(yīng)問題。提高企業(yè)管理水平,合理分配人力資源,以最小的人力創(chuàng)造最佳的生產(chǎn)效率,在企業(yè)信息化發(fā)展的今天,信息運維部門更應(yīng)利用技術(shù)手段實現(xiàn)信息資源共享,而不是將信息資源封閉在一個孤島上,傳統(tǒng)的信息運維經(jīng)驗、規(guī)章制度查詢、管理利用方式僅僅是將相關(guān)資料電子化,更類似于一本電子書籍或雜志,并沒有實現(xiàn)技術(shù)上的創(chuàng)新,對于信息運維工作人員而言,對自身工作量減少和工作效率的提升沒有太多幫助。如何減少重復(fù)性的工作,使信息資源充分共享被利用以達(dá)到發(fā)揮信息資源的最大使用價值。為了解決上述問題,避免同一類似問題被多次鉆研,更好地運用公司的信息運維典型經(jīng)驗,發(fā)揮其價值,運用CBR技術(shù)建立典型經(jīng)驗信息平臺達(dá)到資源共享的最大化。
通過借鑒人類解決問題的方式,基于案例的推理利用相關(guān)領(lǐng)域內(nèi)知識專家日常積累的知識和經(jīng)驗來解決領(lǐng)域中的各種問題,從20世紀(jì)80年代開始逐漸成為人工智能領(lǐng)域的研究熱點。在20世紀(jì)80年代初期,Roger Shank首次提出了CBR理論的認(rèn)知模型及框架。之后Kolodner在此基礎(chǔ)上,開發(fā)出了CTRUS的CBR系統(tǒng)。從此,CBR理論開始走向人工智能領(lǐng)域的研究和應(yīng)用。特別是在20世紀(jì)80年代后期,ReMind系統(tǒng)的出現(xiàn)被認(rèn)為是CBR從認(rèn)知科學(xué)向人工智能方向轉(zhuǎn)變的標(biāo)志[1]。
CBR的研究共分兩方面。研究的其中一方面是各個學(xué)科(如人工智能學(xué)科、數(shù)據(jù)挖掘?qū)W科、思維科學(xué)學(xué)科、計算機(jī)科學(xué)學(xué)科等相關(guān)類別)的知識及相關(guān)理論的集成及在對應(yīng)實踐領(lǐng)域內(nèi)應(yīng)用。具體應(yīng)用表現(xiàn)在天氣、災(zāi)害預(yù)報,以往法律審判裁決,機(jī)器常見隱患故障判斷處理,企業(yè)未來發(fā)展咨詢及重大事項決策,以及解決各類常見通用問題。CBR研究的另一方面是通過某些技術(shù)方式如匹配算法搜索、抽取特征值等從案例檢索、案例修正和案例學(xué)習(xí)等方面的研究深入到相關(guān)方面具體問題的研究[2]。
專家系統(tǒng)在電力系統(tǒng)中已經(jīng)得到了廣泛的應(yīng)用,不過這些應(yīng)用大部分都集中在故障診斷上。主要采用的方法有專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)、優(yōu)化技術(shù)、Petri網(wǎng)絡(luò)、粗糙集理論、模糊集理論、貝葉斯網(wǎng)絡(luò)、多Agent技術(shù)和基于故障錄波器信息等[3-8]。
2.1 CBR技術(shù)介紹
CBR(Case-based Reasoning),以案例為基礎(chǔ)的推理,國內(nèi)學(xué)術(shù)界通常稱之為基于案例的推理。該推理方式和以規(guī)則為基礎(chǔ)的推理方式不同,基于規(guī)則推理方式是通過建立規(guī)則庫,在進(jìn)行案例判斷時通過邏輯運算比較是否符合對應(yīng)規(guī)則來給出對應(yīng)結(jié)果,而CBR的推理方式更多的是通過比較案例庫中某些案例的相似度,給出待解問題的相應(yīng)解決方案,即通過舊案例解決新問題[9-10]。在CBR系統(tǒng)內(nèi),把一個故障或問題事件的發(fā)生原因、現(xiàn)象、導(dǎo)致的結(jié)果及解決的方法描述成一個案例,案例庫就是過去所有已發(fā)生的并已積累下來的知識內(nèi)容,當(dāng)然在CBR中這些案例是需要通過一定的數(shù)據(jù)組織形式存在的,以便隨時調(diào)用。CBR技術(shù)彌補(bǔ)了RBR(基于規(guī)則的推理)的不足,解決了在技術(shù)領(lǐng)域內(nèi)那些在內(nèi)容上表述困難的問題,同時在案例庫自我學(xué)習(xí)、更新技術(shù)上與其他技術(shù)相比也較為先進(jìn)。
CBR的基本思想是[10]將所發(fā)生過的或是待解的問題描述、問題可能導(dǎo)致的結(jié)果、解決問題的方法等內(nèi)容用案例的形式表現(xiàn),案例庫中已存在的案例的積累是一個歷史積淀的過程,是以往處理問題方法經(jīng)驗的總結(jié),在日常遇到新故障時,根據(jù)以往類似故障處理經(jīng)驗即舊案例搜索來解決新故障,同時可將此過程在CBR中作為一個新案例進(jìn)行積累,并作為未來可能會發(fā)生故障的參考案例,如圖1所示。這就像日常進(jìn)行探索性工作時更多的是依靠前人的經(jīng)驗摸索解決。
在CBR方法中,通過案例將無法或者很難以規(guī)則形式表達(dá)的專家求解問題的深層知識和經(jīng)驗保存起來。正確的解答案例保存在案例庫中,當(dāng)處理新的案例的時候,在案例庫中找出與新的案例最匹配(或相似)的一個案例,如果該案例滿足要求,則輸出結(jié)果;否則對最匹配(或相似)的案例進(jìn)行修改以滿足要求,并將修改后的案例添加到案例庫中。
圖1 CBR的基本思想
2.2 案例表示及案例庫的建立
在案例庫的初期階段,由于案例庫中的案例積累數(shù)量相對較少,在組織架構(gòu)上可以相對松散,但案例庫并不是一成不變沒有數(shù)據(jù)更新的,隨著更新案例數(shù)目的逐漸增加,要極力避免這種松散、無序的情況,在數(shù)據(jù)組織形式上,可以用關(guān)系數(shù)據(jù)庫來解決該問題。
用數(shù)據(jù)庫的方式以框架結(jié)構(gòu)為基礎(chǔ)組織案例、存儲案例是目前使用較多的方法,用框架和槽的形式來對應(yīng)相關(guān)案例的特征,數(shù)據(jù)庫中的數(shù)據(jù)項和數(shù)據(jù)表名字則由槽和主框架逐一對應(yīng)表示,其中的每一個槽都可以作為一個子框架,當(dāng)其展開時,數(shù)據(jù)庫內(nèi)的其他數(shù)據(jù)表項可以由這些子框架、子特征作進(jìn)一步關(guān)系對應(yīng),最終完成數(shù)據(jù)庫表和主框架表構(gòu)成關(guān)系。案例庫中大量案例在系統(tǒng)內(nèi)存儲的表現(xiàn)形式就是一個龐大的數(shù)據(jù)表框架結(jié)構(gòu),每當(dāng)有新案例數(shù)據(jù)更新存儲,就存儲數(shù)據(jù)表,對應(yīng)填充數(shù)據(jù)項。
在CBR系統(tǒng)案例推理運行效率上,如何將案例適當(dāng)?shù)谋硎臼亲钪饕膯栴},案例的表示牽涉以下幾項問題:
1)在眾多的信息中哪些是有用的可以存儲在案例中;
2)在描述案例內(nèi)容上用何種結(jié)構(gòu)是合適的;
3)在案例庫內(nèi)該如何進(jìn)行組織和索引。
根據(jù)搜集上來的運維信息文檔的情況,總結(jié)出案例庫所應(yīng)包含的信息:知識編號、知識分類、作者、創(chuàng)建用戶、創(chuàng)建用戶所屬部門、標(biāo)題、摘要、關(guān)鍵字。案例表示即可描述如表1所示。
當(dāng)前的CBR系統(tǒng)大多是用靜態(tài)的框架來描述案例,這種方法有以下的缺點:首先,當(dāng)新的案例不斷出現(xiàn)的時候,舊的框架無法描述新案例的新特征;其次,框架的構(gòu)造是很繁瑣的一項工作,對于CBR系統(tǒng)應(yīng)用而言,只能在那些可以積累大量經(jīng)驗并且這些經(jīng)驗可被反復(fù)使用的知識領(lǐng)域內(nèi)推廣。
用關(guān)系數(shù)據(jù)庫存儲案例是比較通用的方法。在案例庫結(jié)構(gòu)映射上可以通過特征空間結(jié)構(gòu)來實現(xiàn),案例對應(yīng)著記錄,特征分量對應(yīng)著字段,使用時通過以下流程來實現(xiàn):建立一個數(shù)據(jù)庫管理系統(tǒng),可供選擇的軟件很多,如Access、Oracle等;建立一個數(shù)據(jù)庫結(jié)構(gòu)主要功能用作案例存儲;將案例導(dǎo)入到數(shù)據(jù)庫中構(gòu)成案例庫。
表1 案例描述
關(guān)系數(shù)據(jù)庫除了為專家系統(tǒng)提供一種良好的知識組織形式之外,還能夠為專家系統(tǒng)提供強(qiáng)大的索引能力。
案例索引就是能將各個案例彼此區(qū)分的主要關(guān)鍵字匯集,而案例庫索引主要參考了數(shù)據(jù)庫的索引技術(shù),雖一字之差,但還是有區(qū)別的:
1)二者索引時在所選擇的數(shù)據(jù)庫上是通用的,但索引時在關(guān)鍵字的選取和標(biāo)準(zhǔn)的選擇是不同的。案例庫的索引為了區(qū)分各個案例,主要關(guān)注如何從定義上將案例庫劃分為實際有作用的分段。
2)二者在索引時比照關(guān)鍵字的方式不同。在案例檢索上,目前主要采用的關(guān)鍵字相似度匹配的方式;而在案例庫索引上,在數(shù)據(jù)庫系統(tǒng)內(nèi)檢索相關(guān)數(shù)據(jù)記錄時,要精確對應(yīng)相關(guān)關(guān)鍵字段,去除那些不符合條件的記錄。
因此,本文將選取關(guān)系數(shù)據(jù)庫組織和存儲案例,構(gòu)建知識庫,同時在數(shù)據(jù)庫的索引的基礎(chǔ)上,實現(xiàn)對案例的相似匹配。
案例庫的所對應(yīng)的數(shù)據(jù)表結(jié)構(gòu)如表2所示。在表2中,包含如下字段:KNOWLDEGE_ID為知識編號、主鍵;CREATOR是知識的創(chuàng)建者;DEPARTMENT_ID是知識所屬的部門;VERIFY是知識的審核者;TITLE是知識的標(biāo)題;ABSTRACT是知識的摘要;KEYWORD是知識的關(guān)鍵字;FILE_PATH是包含該知識的原始文件的存儲路徑。
表2 案例表
根據(jù)表2給出的案例庫結(jié)構(gòu),給出的電力運維案例實例文檔如表3所示。
表3 案例實例
2.3 案例推理機(jī)制
表4給出了電力運維信息的案例表示方法的8個字段的數(shù)據(jù)類型以及能否作為案例的屬性特征。
表4 屬性特征值的選擇
從表4中可以看到,在這8個字段中,知識編號不能作為屬性特征,這是因為知識編號是案例在數(shù)據(jù)表中存儲的主鍵,對于用戶而言,沒有任何意義。而其他7個字段則都能夠作為屬性特征。
同時也能夠看到,這7個屬性特征都是文本型的。但是這7個屬性特征在相似度計算上也并不是完全一樣,可以將其分成兩大類:
第一類是取值限定在幾個固定的值上的屬性特征,如知識分類和創(chuàng)建用戶所屬部門。這種類型的屬性特征只可能有兩種匹配結(jié)果完全匹配或者不匹配。其特征相似度可以用下式計算
第二類是取值無法限定的屬性特征。剩下的5個屬性特征都屬于這一類。設(shè)Oi和Ei分別為目標(biāo)案例和源案例中的某個屬性特征的文本類型的取值。則Oi和Ei匹配情況則可以表示如下
式(1)與式(2)相比,增加了對于部分匹配的定義。
給出屬性特征的相似度計算公式之后,在計算案例相似度之前還要確定各個屬性特征的權(quán)重。權(quán)重的分配是很多研究領(lǐng)域都會遇到的一個重要問題,如何確定權(quán)重值,方法有很多種,在這里主要考慮的是用原始數(shù)據(jù)的來源來計算權(quán)重,按照這一標(biāo)準(zhǔn)主要有客觀賦權(quán)法和主觀賦權(quán)法兩類:客觀賦權(quán)法,目前對其研究還不是很完善,偶爾會發(fā)生與指標(biāo)的實際重要程度嚴(yán)重偏離的情況,主要算法原理是用數(shù)學(xué)方法計算原始數(shù)據(jù)之間的關(guān)系得出權(quán)重值,目前應(yīng)用較多的有均方差法、主成分分析法等;主觀賦權(quán)法,這一方法客觀性不強(qiáng),需要相關(guān)知識領(lǐng)域?qū)<腋鶕?jù)自有經(jīng)驗判斷原始數(shù)據(jù)并賦予合適的權(quán)值,如AHP法、古林法等;綜合以上兩種算法優(yōu)缺點,學(xué)界內(nèi)新提出了一類算法組合賦權(quán)法,其又分為線性加權(quán)組合方法和乘法合成的歸一化方法兩類。
對于本文根據(jù)專家經(jīng)驗以及用戶使用情況,表5給出了各個屬性特征的初始權(quán)值。然而在實際的使用過程中,用戶輸入的屬性特征可能只是上述7個屬性特征中的一部分,只對用戶輸入的屬性特征進(jìn)行匹配,而忽略沒有輸入的屬性特征。同時用戶也可以根據(jù)自己的情況自行調(diào)整各個屬性特征的權(quán)值。
表5 屬性特征值的權(quán)值
本系統(tǒng)的推理流程如圖2所示。
首先用戶根據(jù)具體情況輸入要查詢案例的屬性特征,輸入的時候可以根據(jù)需要調(diào)整各個屬性特征的默認(rèn)權(quán)值。然后推理機(jī)根據(jù)用戶輸入的屬性特征在案例庫中進(jìn)行相似度匹配。這里系統(tǒng)會有一個默認(rèn)的匹配度的閾值,用戶也可以更改。凡是匹配度大于這個閾值的案例均會匹配成功。如果沒有匹配上的案例,則可以返回重新輸入案例的屬性特征。如果存在匹配的案例,用戶則可以查看這些案例的詳細(xì)信息。當(dāng)用戶沒有找到匹配的案例或者有匹配的案例但是案例的內(nèi)容不能滿足用戶的需求的時候,用戶可以根據(jù)自身的情況添加新的案例。
具體的算法描述如下:步驟一,用戶輸入屬性特征,根據(jù)需要調(diào)整各個屬性特征的權(quán)值以及匹配閾值。步驟二,系統(tǒng)進(jìn)行相似度匹配,如果不存在匹配的案例并且希望重新輸入屬性特征則轉(zhuǎn)步驟一;如果不存在匹配的案例并且希望添加新案例則轉(zhuǎn)步驟四。步驟三,按照相似度從高到低將匹配成功的案例顯示給用戶。如果用戶對這些案例提供的情況滿意,則轉(zhuǎn)步驟五;如果不滿意,想要添加新案例,則轉(zhuǎn)步驟四。步驟四,添加新案例。步驟五,結(jié)束。
圖2 推理流程圖
下面將給出使用本系統(tǒng)進(jìn)行電力信息運維案例推理的具體例子。問題案例描述如下:信息運維人員接到報告反映某變電站遠(yuǎn)程抄表客戶端(采集器)網(wǎng)絡(luò)不通,現(xiàn)場查看后網(wǎng)絡(luò)設(shè)備運行正常,網(wǎng)絡(luò)設(shè)備與采集器之間的網(wǎng)絡(luò)連接正常。之前已處理過類似案例并已在案例庫內(nèi)儲存,此次需要做的是檢索相應(yīng)案例進(jìn)行問題解決。在案例庫內(nèi)儲存的相關(guān)案例知識表如表6所示。
表6 案例知識表
經(jīng)過查詢,發(fā)現(xiàn)滿足此特征的案例共有三項,如圖3所示。
圖3 案例查詢后結(jié)果反饋
由于此故障案例主要針對的是變電站遠(yuǎn)程抄表客戶端網(wǎng)絡(luò)不通,這時我們可進(jìn)一步通過匹配關(guān)鍵字進(jìn)行有針對性的查詢,最終檢索到一個解答案例.
電力信息運維典型經(jīng)驗查詢系統(tǒng)在利用CBR這一技術(shù)后,不管是信息運維技術(shù)人員還是普通員工在遇到日常無法解決的故障后,需要的僅僅是在系統(tǒng)內(nèi)輸入幾個查詢的關(guān)鍵詞即可調(diào)閱出類似的相關(guān)運維經(jīng)驗,處理相關(guān)問題,其實這些功能更類似利用互聯(lián)網(wǎng)的搜索引擎搜索自己所需的相關(guān)資源,通過不斷地嘗試所匹配的案例來解決問題,直到找到最合適的唯一案例或是幾個案例結(jié)合使用為止,彌補(bǔ)了基于規(guī)則匹配的專家系統(tǒng)模糊查詢功能不足的缺陷。
[1]孔艷,劉成新.利用基于案例的推理來支持學(xué)習(xí)[J].中國現(xiàn)代教育裝備,2005(11):95-98.
[2]郭艷紅,鄧貴仕.基于事例的推理研究綜述[J].計算機(jī)工程與應(yīng)用,2004(2).
[3]毛鵬,許揚,蔣平.輸電網(wǎng)故障診斷研究綜述及發(fā)展[J].電力系統(tǒng)保護(hù)與控制,2005,33(22):79-86.
[4]郭創(chuàng)新,朱傳柏,曹一家,等.電力系統(tǒng)故障診斷的研究現(xiàn)狀與發(fā)展趨勢明[J].電力系統(tǒng)自動化,2004,28(1):34-37.
[5]畢天姝,倪以信,楊奇遜.人工智能技術(shù)在輸電網(wǎng)絡(luò)故障診斷中的應(yīng)用述評[J].電力系統(tǒng)自動化,2000,24(25):11-16.
[6]陳玉林,陳允平,孫金莉等.電網(wǎng)故障診斷方法綜述[J].中國電力,2006,39(5):27-31.
[7]曾素瓊.人工智能及其在輸配電網(wǎng)絡(luò)故障診的應(yīng)用[J].海南大學(xué)學(xué)報自然科學(xué)版,2006,24(2):188-193.
[8]廖志偉,孫雅明,葉青華.人工智能技術(shù)在電力系統(tǒng)故障診斷中應(yīng)用[J].電力系統(tǒng)及其自動化學(xué)報,2003,15(6):71-78.
[9]嚴(yán)悅,哈進(jìn)兵.利用ART神經(jīng)網(wǎng)絡(luò)優(yōu)化相似案例匹配方法 [J].信息系統(tǒng)工程,2012,(3):70-74.
[10]趙曉軍,田富強(qiáng),胡和平.流域水量調(diào)度專家系統(tǒng)的應(yīng)用研究[J].水力發(fā)電,2005,21(9):70-74.