国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識圖譜的二次設(shè)備測試自動配置方法

2022-06-16 07:20:48葉遠波李端超王志華王駿東
電力系統(tǒng)保護與控制 2022年12期
關(guān)鍵詞:信息點圖譜準(zhǔn)確率

葉遠波,李端超,謝 民,王志華,王駿東

基于知識圖譜的二次設(shè)備測試自動配置方法

葉遠波1,李端超1,謝 民1,王志華2,王駿東2

(1.國網(wǎng)安徽省電力有限公司,安徽 合肥 230022;2.武漢凱默電氣有限公司,湖北 武漢 430223)

隨著智能變電站的發(fā)展,二次設(shè)備更新?lián)Q代頻繁且智能化程度不斷提升,以往采用手動測試配置的方法已難以滿足工作需求。提出一種基于知識圖譜的二次設(shè)備自動配置方法。首先,模擬常規(guī)測試核心流程,構(gòu)建基于測試任務(wù)的信息點、基于設(shè)備廠家的信息點檢索路徑以及基于測試配置信息類型的命名實體知識三類知識圖譜。然后,根據(jù)測試設(shè)備及測試功能,利用所構(gòu)建的知識圖譜檢索需配置信息點,確定設(shè)備廠家并基于子圖匹配信息路徑。采用改進的BERT模型計算配置信息點與描述文本之間的相似性,從而完成映射配置。此外,還加入了端口地址配置數(shù)據(jù)字符串校驗。實驗仿真結(jié)果表明,基于知識圖譜的二次設(shè)備測試自動配置方法合理有效,并具有極高的準(zhǔn)確性。

二次設(shè)備測試;知識圖譜;BERT模型;文本向量;路徑推理

0 引言

隨著智能變電站快速推進,變電站二次設(shè)備呈現(xiàn)出種類數(shù)量急劇增加、自動化程度明顯提升、安全要求不斷加強的特點[1-5],為變電站二次設(shè)備測試的發(fā)展帶來了機遇與挑戰(zhàn)。智能電子設(shè)備IED(Intelligent Electronic Devices, IED)基于統(tǒng)一的數(shù)字化標(biāo)準(zhǔn)規(guī)約IEC61850實現(xiàn)通信[6]。同樣,二次設(shè)備測試也基于IEC61850規(guī)約解析IED文件實現(xiàn)測試配置[7]。

目前在變電站二次設(shè)備測試時,檢測人員需要根據(jù)應(yīng)用功能種類與測試策略配置對應(yīng)事件、信號、數(shù)據(jù)等信息點,基于不同被測裝置及應(yīng)用業(yè)務(wù)的測試方案故障參數(shù)已經(jīng)預(yù)制完成,通過模擬故障設(shè)置測試參數(shù)并監(jiān)測保護裝置動作情況,從而驗證保護效果及裝置參數(shù)設(shè)置準(zhǔn)確與否[8-9]。

信息點配置是整個檢測過程的關(guān)鍵環(huán)節(jié),即在導(dǎo)入全站系統(tǒng)配置SCD(Substation Configuration Description)文件后,根據(jù)出廠配置信息文件(ICD文件),基于IED輸出端口地址配置數(shù)據(jù)及接口文本描述等信息特征,實現(xiàn)待檢測智能電子設(shè)備IED的模擬數(shù)據(jù)集與實例信息虛鏈接一一映射,但因為ICD虛端子的dU或dAI描述沒有統(tǒng)一規(guī)范,所以大多采用手動配置的方法。變電站設(shè)備繁多,人工配置測試導(dǎo)致效率低下、配置耗時耗力、測試周期長、人員經(jīng)驗及工作狀態(tài)差異明顯,易出現(xiàn)缺項漏項,出錯后糾錯的工作量也很大。

針對這一問題,已有相關(guān)學(xué)者對于信息自動配置方案進行了探討。文獻[10]通過子模版匹配SCD文件的方式實現(xiàn)繼電保護測試配置的實例化,為二次設(shè)備測試提供了新思路,但是該方案的可擴展性及泛化性有待提升。文獻[11]提出基于SCD文件的專家系統(tǒng)完成檢修二次信息的匹配,實現(xiàn)智能變電站測試中安措票的配置,但是分類較為簡單且耗時較長。文獻[9]及文獻[12]均提出了基于利用自然語言處理技術(shù)實現(xiàn)二次設(shè)備自配置,文獻[6]采用TextCNN對智能錄波器配置文件進行文本分類實現(xiàn)端口地址映射,這種方法對于長本文效果較好,但對于短文本具有局限性,且未考慮其他端口地址數(shù)據(jù);文獻[12]利用詞向量表示技術(shù)計算虛端子語義相似度實現(xiàn)鏈接匹配,能夠得到較好的匹配效果,但采用分詞表示的方法在詞向量表示上未考慮文本的全局語義信息,仍有提升空間。通過以上討論可以發(fā)現(xiàn),二次設(shè)備自動配置方案主要基于兩種思路:一是利用模板等先驗知識進行匹配,準(zhǔn)確性高但泛化性低;二是利用配置信息相似性進行分類或相似度計算,適應(yīng)性強但均為單設(shè)備配置。

知識圖譜作為一種模擬人類思維方式的多源異構(gòu)實體及關(guān)系表征大數(shù)據(jù)技術(shù)[13],可解釋性及數(shù)據(jù)存儲結(jié)構(gòu)性能優(yōu)越[14-15],已在數(shù)據(jù)檢索、推薦系統(tǒng)、知識推理等方面得到廣泛運用[16],同時在電力領(lǐng)域的數(shù)據(jù)運維、電力文本表征及電網(wǎng)動態(tài)輔助決策等方面做出了初步研究探索[17-20]。大量投運變電站的SCD可作為知識數(shù)據(jù)蒸餾樣本基礎(chǔ),且知識圖譜技術(shù)能夠很好地表征IED文件中的文本、字符等多源異構(gòu)數(shù)據(jù)。因此,本文提出基于知識圖譜的二次設(shè)備測試自動配置方法,將先驗知識匹配與配置信息相似性計算兩種配置方式的優(yōu)勢相結(jié)合,利用知識圖譜多跳路徑匹配進行配置信息查詢及抓取,并采用改進BERT模型計算配置信息相似度,從而實現(xiàn)準(zhǔn)確高效的多設(shè)備多任務(wù)二次設(shè)備測試自動配置。

1 二次設(shè)備測試配置文件信息解析

智能變電站二次設(shè)備測試配置需根據(jù)測試任務(wù)映射對應(yīng)數(shù)據(jù)集參數(shù)信息點,不同測試任務(wù)的信息需求具有差異性,在確認目標(biāo)信息需求的基礎(chǔ)上,通過IED輸出端口地址配置數(shù)據(jù)與文本描述信息映射對應(yīng)信息點,即可實現(xiàn)測試信息配置。SCD文件解析示意圖如圖1所示,配置所需端口地址配置數(shù)據(jù)與文本描述信息均存儲于SCD文件中,該文件描述了智能變電站中各IED的數(shù)據(jù)模型、配置信息及相互間邏輯鏈接關(guān)系,所有裝置在SCD文件中均表現(xiàn)為一級IED節(jié)點及其節(jié)點內(nèi)嵌套的各層子節(jié)點信息,遵循IEC61850規(guī)約[21],IED結(jié)構(gòu)主要包含訪問點、邏輯設(shè)備、邏輯節(jié)點、數(shù)據(jù)屬性、數(shù)據(jù)信息等。IED之間通過虛端子鏈接,主要包含采樣值(SV)與通用對象變電站事件(GOOSE)信息,解析配置文件即明確IED的SV與GOOSE的信息關(guān)系,由于SCD數(shù)據(jù)嵌套復(fù)雜性及SV與GOOSE信息關(guān)系的隱晦性,故通過匹配端口地址配置數(shù)據(jù)與文本描述完成信息關(guān)系映射與信息配置。

圖1SCD文件解析示意圖

Fig. 1Schematic diagram of SCD file parsing

本文采用元素樹方式遍歷SCD文件的嵌套數(shù)據(jù),以各設(shè)備IED節(jié)點為初始節(jié)點,按照IED層次結(jié)構(gòu)深度優(yōu)先為原則訪問其各層子節(jié)點的屬性及元素,然后通過字典列表的形式存儲端口地址配置數(shù)據(jù)、文本描述及對應(yīng)嵌套路徑,如此既獲得了匹配需要的關(guān)鍵信息,又保留了信息獲取路徑,為構(gòu)建二次設(shè)備測試自動配置知識圖譜奠定數(shù)據(jù)基礎(chǔ)。

2 知識圖譜構(gòu)建

智能變電站二次設(shè)備測試配置需要依次明晰三個內(nèi)容,首先是確定完成某種任務(wù)功能測試所需要配置的全部信息點,隨后是根據(jù)不同設(shè)備廠家的IED數(shù)據(jù)格式清楚對應(yīng)信息的層次路徑及描述特征,最終基于信息特征判斷配置信息點的映射關(guān)系正確性。基于以上配置邏輯與流程,本文設(shè)計的二次設(shè)備測試自動配置知識圖譜數(shù)據(jù)模型及架構(gòu)共包含三類,如圖2所示,分別是基于測試任務(wù)的信息點知識圖譜、基于設(shè)備廠家的信息點檢索路徑知識圖譜、基于測試配置信息類型的實體命名知識圖譜。接下來針對不同部分知識圖譜構(gòu)建進行介紹。

圖2二次設(shè)備測試自動配置知識圖譜數(shù)據(jù)模型及架構(gòu)

Fig. 2Data model and architecture of knowledge graph for automatic configuration of secondary equipment test

2.1 測試任務(wù)信息點

智能變電站中需要測試的二次設(shè)備包括繼電保護裝置、合并單元、智能終端、智能錄波器等多種設(shè)備,不同二次設(shè)備相對應(yīng)的測試內(nèi)容截然不同,且同種設(shè)備在不同狀態(tài)下的測試內(nèi)容也具有一定的差異性。例如繼電保護裝置測試具有變壓器、線路、母線等多種位置場景,測試內(nèi)容包含定值設(shè)置、采樣精度、動作信息、開入開出量等,所需配置的信息點包含SV輸入、GOOSE輸入及輸出端口地址配置數(shù)據(jù)、保護功能壓板、保護動作元件、保護動作相別及保護動作時間等。

針對該部分內(nèi)容,在二次設(shè)備測試規(guī)定文件及廠家測試配置信息中已做出了對應(yīng)說明。本文采用模板匹配的方式對文件進行抽取、匹配、融合并進行人工校驗,構(gòu)建的二次設(shè)備繼電保護測試的部分信息點知識圖譜數(shù)據(jù)示例如圖3所示。

圖3 部分信息點知識圖譜數(shù)據(jù)示例

2.2 設(shè)備廠家信息點檢索路徑

二次設(shè)備測試信息配置工作具有重復(fù)性及經(jīng)驗性,對應(yīng)信息點在SCD文件中的位置在一定程度上相對統(tǒng)一,故而可通過尋找相似信息路徑的方式來配置信息。

本文以2.1節(jié)圖譜中的信息點為核心及出發(fā)點,在解析的字典中以深度優(yōu)先的檢索方式進行匹配,查找到對應(yīng)信息則保存由IED節(jié)點至該信息點的檢索路徑,對同類信息的路徑進行統(tǒng)計、篩查,保留路徑相似度較高的路徑作為檢索路徑。

但這種方法也存在一定的漏洞,例如二次設(shè)備廠家主要有南瑞、許繼、四方等,各廠家間IED層次嵌套具有一定區(qū)別,不同版本設(shè)備信息表征方式同樣可能具有差異性,且存在設(shè)備配置端口地址配置數(shù)據(jù)與描述信息規(guī)范性不足的問題。

針對以上問題提出兩種解決思路:一是對不同廠家設(shè)備構(gòu)建不同的信息點檢索路徑以解決廠家不同的問題;二是信息點檢索采用多路徑檢索,因為通過觀察解析保存的字典信息發(fā)現(xiàn),一般前幾層的嵌套信息路徑基本統(tǒng)一,在邏輯節(jié)點后的從屬層信息路徑及內(nèi)容才會出現(xiàn)差異,多為版本差異造成,因此通過保留多個相似度較高路徑作為備選路徑。

2.3 測試配置信息命名實體

當(dāng)完成信息點確認及廠家信息點路徑檢索后,便到達二次設(shè)備配置的最終環(huán)節(jié),即確認最終的測試點信息點與數(shù)據(jù)集的映射關(guān)系,也是整個配置環(huán)節(jié)中最關(guān)鍵的步驟。端口地址配置數(shù)據(jù)與文本描述信息雖然在格式上存在較大區(qū)別,但同一廠家設(shè)備信息邏輯上具有強關(guān)聯(lián)性,相同實體命名及表述基本統(tǒng)一,因此挖掘其實體命名規(guī)律對于信息自動配置具有重要作用。

基于處理SCD文件獲得的字典列表數(shù)據(jù),抽取廠家、端口地址配置數(shù)據(jù)及文本描述三類信息,鏈接實體以{廠家,端口地址配置數(shù)據(jù),文本描述}形成三元組,初始抽取結(jié)果存在大量冗余數(shù)據(jù),一類是完全重復(fù)的數(shù)據(jù),另一類是由于區(qū)分同類數(shù)據(jù)不同實體而給端口地址配置數(shù)據(jù)增加的無實意編號。

本文將三元組中端口地址配置數(shù)據(jù)信息中的數(shù)字量信息刪除,僅保留字母字符串量信息。然后以廠家與文本描述的融合信息構(gòu)建索引,統(tǒng)計每類索引中端口地址配置數(shù)據(jù)的種類及個數(shù),按照統(tǒng)計結(jié)果將三元組進行轉(zhuǎn)化,僅保留同類索引中相同端口地址配置數(shù)據(jù)的一個三元組。此外,將相同三元組的統(tǒng)計個數(shù)以屬性值性質(zhì)嵌入,從而實現(xiàn)將大量冗余實體消歧并融合,最終形成廠家、文本描述、端口地址配置數(shù)據(jù)表述的簡化子圖,基于測試配置信息類型的部分命名實體知識圖譜數(shù)據(jù)示例如圖4所示。

圖4 部分命名實體知識圖譜數(shù)據(jù)示例

3 基于知識圖譜的配置自動推理方法

3.1 基于改進BERT模型的文本相似度匹配算法

短文本相似性不是直接計算兩個原始文本,需將源文本轉(zhuǎn)換為計算機可以理解和處理的數(shù)據(jù),而計算機更善于處理向量模式數(shù)據(jù),所以一般將文本聚焦于向量空間中進行度量,常見的模型有詞袋模型和詞嵌入。詞袋模型通常與詞頻-逆文本頻率聯(lián)合使用,常見的有向量空間模型、淺語義分析、隱含狄利克雷分布等,詞袋模型較為簡單但具有一定的限制性,沒有考慮詞序、稀疏性、復(fù)雜性問題,對于處理本文較短的電力描述信息難以挖掘足夠的語義信息。詞嵌入常見的如Word2Vec、TextCNN、BERT模型等[22],在泛化性及語義信息理解上有了極大的提升。本文選取目前應(yīng)用最為廣泛的BERT模型為基礎(chǔ)模型,考慮文本較短的情況,故而采用基于字向量的BERT模型對文本進行分布式嵌入。BERT模型基礎(chǔ)結(jié)構(gòu)如圖5所示。

圖5 BERT模型結(jié)構(gòu)

將初始向量采用注意力機制求解,采用Softmax函數(shù)歸一化為概率分布,如式(4)所示。

考慮基于字向量的文本嵌入模型對于電力領(lǐng)域詞匯特征提取有一定的局限性,缺乏一定的先驗知識與背景信息,對于專有詞匯的表征可能會出現(xiàn)一定偏差。因此本文提出在字向量基礎(chǔ)上融合二次測試專有詞匯的詞嵌入向量,從而豐富描述短文本的特征表征信息。

基于獲得的文本向量,采用應(yīng)用最為廣泛的余弦相似度度量文本相似度,如式(10)。

求得的距離與相似度成反比,距離越小則相似度越大,與給定配置信息點距離最小的短文本描述即為所要匹配映射的配置信息描述。最終改進BERT模型處理流程如圖6所示。

圖6 改進BERT模型處理流程

3.2 多圖分級推理的信息配置模型

二次設(shè)備測試配置本質(zhì)上是一項信息檢索匹配任務(wù),任務(wù)具有很強的程式性與邏輯性,模型需要協(xié)調(diào)信息配置順序,強調(diào)配置結(jié)果準(zhǔn)確率,同時兼顧配置效率,在考慮以上因素的基礎(chǔ)上本文提出多圖分級推理的信息配置模型來實現(xiàn)二次設(shè)備測試的自動配置,具體流程如圖7所示。

圖7 配置具體流程圖

圖8 檢索路徑匹配子圖模板構(gòu)造

基于編輯距離計算字符串相似度公式為

4 算例結(jié)果與分析

4.1 實驗數(shù)據(jù)

為了驗證本文所提模型及方法在二次設(shè)備測試配置任務(wù)中的有效性,本文選取許繼、南瑞、平高三個廠家的設(shè)備進行測試,重點研究保護、測控、智能終端及合并單元典型測試任務(wù)[25],抽取各廠家已配置成功的測試設(shè)備映射關(guān)系IED數(shù)據(jù)5 000條作為配置樣本。樣本按廠家隨機分成5份:選擇其中4份作為訓(xùn)練集,構(gòu)建知識圖譜并訓(xùn)練文本向量;1份作為測試集,且測試集不分廠家隨機打亂,利用測試集衡量算法及模型效果。部分?jǐn)?shù)據(jù)樣本如表1所示,可以看出文本描述與配置信息點相似度很大,但在描述上也具有一定區(qū)別。端口地址配置數(shù)據(jù)大部分字符串具有一定解釋性,例如“PIGO”表示跳閘,“PROT”表示保護,但同樣兩個閉鎖重合閘配置信息點端口地址配置數(shù)據(jù)卻完全不同,是因為廠家命名區(qū)別,且存在例如“Amp1”“Ind90”等釋義難以確定字符串,但其在描述上具有高度相似性,這也是本文選擇主要以文本匹配信息點的原因之一。

表1 部分樣本示例

4.2 評價指標(biāo)

本文測試數(shù)據(jù)均為配置完成數(shù)據(jù),因此檢索結(jié)果具有唯一性,即通過最終基于本文所提方法的配置數(shù)據(jù)判斷檢索結(jié)果。匹配成功則為正確,匹配失敗則為錯誤,匹配失敗則繼續(xù)匹配,至多匹配5次。將一個信息點匹配作為一次匹配任務(wù),通過建立準(zhǔn)確度(ACC)和平均倒數(shù)排名(MRR)作為匹配結(jié)果的評價指標(biāo)[26],以評估任務(wù)路徑匹配與文本相似度匹配效果,如式(15)、式(16)所示。

4.3 實驗環(huán)境及參數(shù)

本次實驗環(huán)境為Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10 GHz 八核,NVIDIA Corporation GP102 [GeForce GTX 1080 Ti],Ubuntu 16.04 操作系統(tǒng),采用python語言編程,改進BERT模型基于TensorFlow深度學(xué)習(xí)框架構(gòu)建。模型中各參數(shù)設(shè)置如表2所示。

表2 模型重要參數(shù)設(shè)置

4.4 實驗設(shè)置及結(jié)果分析

4.4.1路徑檢索方法驗證

本文提出的二次設(shè)備測試配置方法首先要尋找到所要匹配的配置信息在IED文件中的嵌套位置,即檢索位置路徑。通過在1圖譜中匹配配置信息點可極大減少依靠經(jīng)驗的重復(fù)性工作,實驗中發(fā)現(xiàn)構(gòu)建每類任務(wù)的配置信息點雖然具有一定的工作量,但是構(gòu)建完成后可一直使用,能夠提升配置準(zhǔn)確率,減少操作失誤,單次檢索時間小于0.001 s。此外,基于2圖譜關(guān)系抽取,可自動確定待測試設(shè)備廠家,實現(xiàn)對設(shè)備廠家快速分類并為后續(xù)子圖匹配及信息匹配奠定基礎(chǔ)。以上兩項任務(wù)在實驗中均未發(fā)生匹配錯誤的情況,驗證了其邏輯合理并處理高效。

基于圖譜2的子圖匹配方式與關(guān)系型數(shù)據(jù)庫兩種方式檢索路徑的時間復(fù)雜度如表3所示,可以看出子圖匹配的方式能夠極大地減少時間支出,且檢索邏輯清晰明了,相比較而言通過關(guān)系型數(shù)據(jù)庫查找相對復(fù)雜一些,對于配置人員來說難度極大。

表3 不同數(shù)據(jù)庫檢索路徑時間復(fù)雜度對比

為了驗證路徑檢索結(jié)果性能,本文通過設(shè)置單次任務(wù)1~4條最相似路徑分別在測試集進行路徑匹配,抓取路徑下所有待匹配文本描述與端口地址配置數(shù)據(jù),所獲得數(shù)據(jù)中含有映射正確的待匹配信息點數(shù)據(jù)則為正確,計算指標(biāo)結(jié)果如表4所示。

表4 不同數(shù)量相似路徑下檢索結(jié)果對比

從表4中可以看出,基于路徑檢索獲取待匹配信息完全能夠滿足任務(wù)需求,只匹配最相似路徑便可獲得95%以上的準(zhǔn)確率,并且在匹配兩條最相似路徑時準(zhǔn)確率又得到了0.32%的提升。通過觀察結(jié)果發(fā)現(xiàn),設(shè)備版本變化帶來的IED文件嵌套格式變化波動不大,隨著后續(xù)匹配路徑的數(shù)量增加,準(zhǔn)確率上升趨勢減緩,這也說明了信息匹配路徑具有極大相似性,同時驗證了本文所提路徑檢索方法有效。

4.4.2改進BERT模型性能評估

為了評估本文提出的基于字向量并融入關(guān)鍵詞向量的改進BERT文本嵌入式表示模型,選取VSM、Word2Vec以及考慮細粒度、多頭注意力機制及關(guān)鍵詞的BERT模型進行比較,待匹配文本數(shù)據(jù)基于路徑檢索正確情況下所獲得的數(shù)據(jù),結(jié)果對比如表5所示。

表5 不同文本匹配模型結(jié)果對比

從上述各方法匹配的結(jié)果來看,采用融合多頭注意力機制、字粒度、關(guān)鍵詞的BERT模型取得了最高的準(zhǔn)確率及平均倒數(shù)排名,實驗1采用傳統(tǒng)向量空間模型VSM,準(zhǔn)確率僅達到82.2%,而實驗2~6準(zhǔn)確率均達到了90%以上,原因在于VSM對于數(shù)據(jù)依賴性較強,過于機械化,而實驗2~6屬于深度學(xué)習(xí)模型,生成的表示向量具有一定的語義特征,更能夠反映真實文本含義。同時,在相同的BERT模型下,實驗5相較于實驗4在指標(biāo)上分別獲得了1.1%準(zhǔn)確率提升和1.2%的平均倒數(shù)排名提升,說明針對二次設(shè)備測試配置短文本采用字粒度能夠獲得更好的詞義表示向量。此外,本文融合基于關(guān)鍵詞的詞粒度BERT模型語義表征向量在評估結(jié)果中取得了最優(yōu)效果,相對于未考慮關(guān)鍵詞的實驗5提升了2.5%的準(zhǔn)確率以及2.2%的平均倒數(shù)排名,兩項指標(biāo)均達到了98%以上,甚至前5平均倒數(shù)排名達到了98.9%的極優(yōu)性能,說明考慮領(lǐng)域關(guān)鍵詞相當(dāng)于對深度學(xué)習(xí)BERT模型增加了一部分先驗知識,起到對描述文本向量表征的補充作用。

4.4.3自動配置方法評價

本文所提出的二次設(shè)備測試自動配置方法主要由兩個關(guān)鍵環(huán)節(jié)組成。一是圖譜匹配獲取信息點路徑抓取待匹配輸出端口地址配置數(shù)據(jù)及接口文本描述數(shù)據(jù);二是在抓取的數(shù)據(jù)中基于改進BERT進行相似度計算得到匹配數(shù)據(jù)并校驗。下面將各環(huán)節(jié)結(jié)合為整體進行評估,考慮不同的最相似路徑抓取數(shù)量、文本相似度匹配模型及是否加入字符串校驗因素,以最終匹配準(zhǔn)確率及用時作為評價指標(biāo),實驗設(shè)置10輪,每輪實驗設(shè)置配置100個測試任務(wù),耗時為每輪任務(wù)平均耗時,實驗結(jié)果如表6所示。

表6 不同文本匹配模型結(jié)果對比

觀察表6可發(fā)現(xiàn),16個實驗設(shè)置互為對照,從實驗結(jié)果可以對路徑抓取、模型改進、校驗成效三個方面實驗結(jié)果進行綜合討論。首先,實驗1~4、實驗5~8、實驗9~12以及實驗13~16四組實驗在模型及是否校驗統(tǒng)一的情況下,抓取路徑數(shù)量與耗時成正比增加,不難理解,抓取數(shù)量增加則意味著所要進行的相似度計算規(guī)模也相應(yīng)擴大,從而造成時間成本的增加。實驗4比實驗1耗時增加了近4倍,雖然犧牲了時間但換取了準(zhǔn)確率的提升,當(dāng)抓取數(shù)量從1升至2時,四組對比實驗準(zhǔn)確率均上升了3%左右。在抓取數(shù)量從2升至3及從3升至4時,準(zhǔn)確率提升較小,甚至出現(xiàn)了準(zhǔn)確率下降的情況。依據(jù)配置錯誤實驗結(jié)果發(fā)現(xiàn),抓取路徑增多直接帶來待匹配數(shù)據(jù)量成倍增加,由此加大了匹配難度,帶來相似度計算性能下降,又因為版本變化帶來路徑變化的情況較少發(fā)生,出現(xiàn)三種或四種路徑的情況較少,所以出現(xiàn)了路徑數(shù)量為2時準(zhǔn)確率提升較大,后續(xù)增加路徑數(shù)量提升較少的情況。

實驗1~4與實驗5~8互為對照,同樣實驗9~12與實驗13~16互為對照,這兩組對照的變量為模型,通過觀察實驗結(jié)果不難發(fā)現(xiàn),改進BERT模型比基礎(chǔ)BERT模型在準(zhǔn)確率上有較大提升,兩組8個實驗對比準(zhǔn)確率平均提升了4.7%,再一次說明了本文所提改進模型的有效性,同時,改進模型帶來的時間成本增加在2 s左右,在可接受范圍內(nèi),在實際應(yīng)用時,可根據(jù)任務(wù)環(huán)境選擇模型。

實驗1~8與實驗9~16在是否進行字符串校驗的變量因素上形成互為對照,由于增加了編輯距離計算過程,所以造成了一定的時間成本增加,每輪平均耗時增加4.9 s。但從準(zhǔn)確率上來說,增加字符串校驗對于準(zhǔn)確率的提升具有一定積極作用,平均提升1.3%的準(zhǔn)確率。

通過對上述對比試驗討論,證明了路徑檢索方法、改進BERT模型及字符串校驗在二次設(shè)備測試配置中具有顯著作用。此外,從整體上看,實驗16準(zhǔn)確率達到了98.3%,再次直觀驗證了本文所提二次設(shè)備自動配置方法切實有效。

5 結(jié)論

本文考慮到二次設(shè)備測試人工配置效率低且易出錯的問題,提出了一種基于知識圖譜的二次設(shè)備自動配置方法,結(jié)論如下:

1) 通過構(gòu)建二次設(shè)備測試知識圖譜,將IED文件與測試任務(wù)、測試設(shè)備、配置信息點、信息路徑建立知識關(guān)聯(lián),在此基礎(chǔ)上實現(xiàn)了自動抓取待匹配信息點的端口地址配置數(shù)據(jù)及文本描述,從而為信息映射匹配奠定了基礎(chǔ)。實驗證明,路徑檢索準(zhǔn)確率至少可達到95%以上。

2) 以BERT模型為基礎(chǔ),在字向量BERT模型基礎(chǔ)上融合二次測試專有詞匯的詞嵌入向量,有效增加了文本相似度識別過程中的先驗知識,準(zhǔn)確率平均提升了4.7%,最高可達到96.7%。增加了端口地址配置數(shù)據(jù)字符串校驗環(huán)節(jié)以解決文本描述無法確定映射數(shù)據(jù)的情況,進一步將準(zhǔn)確率提升約1.3%,有效地實現(xiàn)信息點與文本描述的映射匹配。

3) 通過設(shè)置多變量對照實驗,配置準(zhǔn)確率最高達到98.3%。并對路徑抓取、模型改進、校驗成效進行綜合評估,實驗發(fā)現(xiàn),增加校驗環(huán)節(jié)及采用改進BERT模型對于準(zhǔn)確率提升均有較大作用,且耗時上不會有較大影響。增加最相似路徑抓取數(shù)量對于提升待匹配數(shù)據(jù)中配置映射準(zhǔn)確率有一定效果,但在整個配置環(huán)節(jié)中準(zhǔn)確率并非隨著路徑數(shù)量增加而線性增加,因為路徑數(shù)量增加帶來的待匹配描述文本數(shù)量成倍增加,由此帶來的耗時增加及可能的相似度計算準(zhǔn)確率下降仍需納入工作考量。

[1] HE Yuqing, CHEN Yuehui, YANG Zhiqiang, et al. A review on the influence of intelligent power consumption technologies on the utilization rate of distribution network equipment[J]. Protection and Control of Modern Power Systems, 2018, 3(2): 183-193.

[2] 張巧霞, 王廣民, 李江林, 等. 變電站遠程運維平臺設(shè)計與實現(xiàn)[J]. 電力系統(tǒng)保護與控制, 2019, 47(10): 164-172.

ZHANG Qiaoxia, WANG Guangmin, LI Jianglin, et al. Design and implementation of substation remote operation and maintenance platform[J]. Power System Protection and Control, 2019, 47(10): 164-172.

[3] 李寶潭, 趙丹, 李寶偉, 等. 智能變電站在線防誤系統(tǒng)關(guān)鍵技術(shù)的研究[J]. 智慧電力, 2020, 48(6): 73-78, 111.

LI Baotan, ZHAO Dan, LI Baowei, et al. Key technologies of online error prevention system in smart substation[J]. Smart Power, 2020, 48(6): 73-78, 111.

[4] 錢平, 楊松偉, 張永, 等. 面向智能變電站信息流可靠性分析方法研究[J]. 電測與儀表, 2021, 58(10): 106-111.

QIAN Ping, YANG Songwei, ZHANG Yong, et al. Research on reliability analysis method of information flow in intelligent substation[J]. Electrical Measurement & Instrumentation, 2021, 58(10): 106-111.

[5] 范衛(wèi)東, 董金星, 馮曉偉, 等. 智能變電站二次操作校核方法研究[J]. 電測與儀表, 2020, 57(13): 40-46, 54.

FAN Weidong, DONG Jinxing, FENG Xiaowei, et al. Research on checking method of secondary operation in smart substation[J]. Electrical Measurement & Instrumentation, 2020, 57(13): 40-46, 54.

[6] 吳在軍, 胡敏強. 基于IEC 61850標(biāo)準(zhǔn)的變電站自動化系統(tǒng)研究[J]. 電網(wǎng)技術(shù), 2003, 27(10): 61-65.

WU Zaijun, HU Minqiang. Research on a substation automation system based on IEC61850[J]. Power System Technology, 2003, 27(10): 61-65.

[7] 陳德輝, 須雷, 趙希才. 智能變電站自動化與保護核心 IEC 標(biāo)準(zhǔn)的進展與分析[J]. 電力系統(tǒng)自動化, 2019, 43(21): 229-239.

CHEN Dehui, XU Lei, ZHAO Xicai. Progress and analysis of intelligent substation automation and protection core IEC standards[J]. Automation of Electric Power Systems, 2019, 43(21): 229-239.

[8] 諸源勝. 智能變電站二次設(shè)備一體化測試系統(tǒng)的研制及應(yīng)用[D]. 廣州: 華南理工大學(xué), 2020.

CHU Yuansheng. Development and application of integrated test system for secondary equipment of the intelligent substation[D]. Guangzhou: South China University of Technology, 2020.

[9] 陳旭, 張弛, 劉千寬, 等. 基于深度語義學(xué)習(xí)的智能錄波器自配置方法[J]. 電力系統(tǒng)保護與控制, 2021, 49(2): 179-187.

CHEN Xu, ZHANG Chi, LIU Qiankuan, et al. Automatic configuration method of intelligent recorder based on deep semantic learning[J]. Power System Protection and Control, 2021, 49(2): 179-187.

[10] 張曉莉, 劉慧海, 李俊慶, 等. 智能變電站繼電保護自動測試平臺[J]. 電力系統(tǒng)自動化, 2015, 39(18): 91-96.

ZHANG Xiaoli, LIU Huihai, LI Junqing, et al. Automatic test platform in smart substation for relay protection[J]. Automation of Electric Power Systems, 2015, 39(18): 91-96.

[11] FAN Wen, LIAO Yuan. Wide area measurements based fault detection and location method for transmission lines[J]. Protection and Control of Modern Power Systems, 2019, 4(1): 53-64.

[12] 范衛(wèi)東, 馮曉偉, 董金星, 等. 基于歷史數(shù)據(jù)語義相似度的智能變電站虛端子自動連接[J]. 電力系統(tǒng)保護與控制, 2020, 48(17): 179-186.

FAN Weidong, FENG Xiaowei, DONG Jinxing, et al. Automatic matching method of a virtual terminal in intelligent substation based on semantic similarity of historical data[J]. Power System Protection and Control, 2020, 48(17): 179-186.

[13] SINGHAL A. Introducing the knowledge graph: things, not strings[J]. Official Google Blog, 2012.

[14] WANG Xiang, WANG Dingxian, XU Canran, et al. Explainable reasoning over knowledge graphs for recommendation[C] // Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence, AAAI, 2019, Honolulu, USA: 5329-5336.

[15] JI Shaoxiong, PAN Shirui, CAMBRIA E, et al. A survey on knowledge graphs: representation, acquisition and applications[J]. arXiv preprint arXiv: 2002.00388, 2020.

[16] 饒子昀, 張毅, 劉俊濤, 等. 應(yīng)用知識圖譜的推薦方法與系統(tǒng)[J]. 自動化學(xué)報, 2021, 9(3): 2061-2077.

RAO Ziyun, ZHANG Yi, LIU Juntao, et al. Recommendation methods and systems using knowledge graph[J]. Acta Automatica Sinica, 2021, 9(3): 2061-2077.

[17] DAI Renchang, LIU Guangyi, WANG Zhiwei, et al. A novel graph-based energy management system[J]. IEEE Transactions on Smart Grid, 2019, 11(3): 1845-1853.

[18] 劉廣一, 王繼業(yè), 李洋, 等. “電網(wǎng)一張圖”時空信息管理系統(tǒng)[J]. 電力信息與通信技術(shù), 2020, 18(1): 7-17.

LIU Guangyi, WANG Jiye, LI Yang, et al. “One graph of power grid” spatio-temporal information management system[J]. Electric Power Information and Communication Technology, 2020, 18(1): 7-17.

[19] 喬驥, 王新迎, 閔睿, 等. 面向電網(wǎng)調(diào)度故障處理的知識圖譜框架與關(guān)鍵技術(shù)初探[J]. 中國電機工程學(xué)報, 2020, 40(18): 5837-5848.

QIAO Ji, WANG Xinying, MIN Rui, et al. Framework and key technologies of knowledge-graph-based fault handling system in power grid[J]. Proceedings of the CSEE, 2020, 40(18): 5837-5848.

[20] 余建明, 王小海, 張越, 等. 面向智能調(diào)控領(lǐng)域的知識圖譜構(gòu)建與應(yīng)用[J]. 電力系統(tǒng)保護與控制, 2020, 48(3): 29-35.

YU Jianming, WANG Xiaohai, ZHANG Yue, et al. Construction and application of knowledge graph for intelligent dispatching and control[J]. Power System Protection and Control, 2020, 48(3): 29-35.

[21] APOSTOLOV A. Efficient maintenance testing in digital substations based on IEC 61850 edition 2[J]. Protectionand Control of Modern Power Systems, 2017, 2(4): 407-420.

[22] GUTIéRREZ L, KEITH B. A systematic literature review on word embeddings[C] // International Conference on Software Process Improvement, Springer, Cham, 2018: 132-141.

[23] DEVLIN J, CHANG M W, LEE K, et al. Bert: pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv: 1810.04805, 2018.

[24] LI Yujian, LIU Bo. A normalized Levenshtein distance metric[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(6): 1091-1095.

[25] 陳桂芳, 董秀成, 鄭永康, 等. 基于長短期記憶網(wǎng)絡(luò)的繼電保護測試故障診斷研究[J/OL]. 電力系統(tǒng)保護與制: 1-9[2021-12-20]. https://doi.org/10.19783/j.cnki.pspc. 210624.

CHEN Guifang, DONG Xiucheng, ZHENG Yongkang, et al. Fault diagnosis of a relay protection test based on a long short-term memory network[J]. Power System Protection and Control: 1-9[2021-12-20]. https://doi.org/10.19783/j. cnki.pspc.210624.

[26] YU Y, LI Y, SHEN J, et al. STEAM: Self-supervised taxonomy expansion with mini-paths[C] // Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2020: 1026-1035.

Automatic configuration method of secondary equipment test based on a knowledge graph

YE Yuanbo1, LI Duanchao1, XIE Min1, WANG Zhihua2, WANG Jundong2

(1. State Grid Anhui Electric Power Co., Ltd., Hefei 230022, China; 2. Wuhan Kemov Electric Co., Ltd., Wuhan 430223, China)

With the development of smart substations, the replacement of secondary equipment is frequent and intelligence is increasingly improved. The former manual test configuration method finds it difficult to meet the work needs.An automatic configuration method for secondary equipment based on a knowledge graph is proposed. First, the core process of conventional testing is simulated to build a knowledge graph based on three types of data, test task information points, information point retrieval paths of equipment manufacturers, and named entity knowledge of test configuration information types. Then, from the test equipment and testing capabilities, the information points needed to be configured are retrieved by the constructed knowledge graph, the device manufacturer is determined and the information path is matched based on the subgraph. The improved BERT model is used to calculate the similarity between the configuration information points and the description text to complete the mapping configuration. In addition, a string verification of port address configuration data is added. The simulation results show that the method based on the knowledge graph is reasonable and effective and has high accuracy.

secondary equipment test; knowledge graph; BERT model; text vector; path reasoning

10.19783/j.cnki.pspc.211193

2021-08-30;

2021-12-21

葉遠波(1973—),男,碩士,教授級高工,研究方向為電力系統(tǒng)繼電保護;E-mail: 13905608638@139.com

王駿東(1996—),男,通信作者,碩士研究生,研究方向為電力知識圖譜。E-mail: 1825893405@qq.com

This work is supported by the Science and Technology of State Grid Corporation of China (No. 5212002000AR).

國家電網(wǎng)公司科技項目資助(5212002000AR)

(編輯 魏小麗)

猜你喜歡
信息點圖譜準(zhǔn)確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
繪一張成長圖譜
一種基于模板的配電終端信息點表自動生成方案
運用“三講”模型來講題
教師·上(2019年11期)2019-02-24 07:12:59
高速公路車牌識別標(biāo)識站準(zhǔn)確率驗證法
補腎強身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
醫(yī)療建筑智能化施工中常見問題的協(xié)調(diào)解決
主動對接你思維的知識圖譜
乃东县| 高唐县| 申扎县| 和田县| 景东| 乐至县| 临朐县| 桃园市| 嵊州市| 金堂县| 巨鹿县| 颍上县| 郧西县| 壤塘县| 富源县| 兴文县| 喜德县| 色达县| 志丹县| 秦安县| 克拉玛依市| 南澳县| 镇赉县| 油尖旺区| 镇安县| 始兴县| 新沂市| 牙克石市| 昌江| 东明县| 吉木乃县| 宜君县| 佳木斯市| 温泉县| 抚州市| 广河县| 田阳县| 石渠县| 石门县| 芦溪县| 保德县|