国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

配電網(wǎng)電力設(shè)備缺陷文本智能辨識(shí)運(yùn)維綜述

2022-05-09 03:01:40張磐鄭悅李海龍劉航旭李國(guó)棟葛磊蛟
電力建設(shè) 2022年5期
關(guān)鍵詞:電力設(shè)備圖譜錯(cuò)誤

張磐, 鄭悅,李海龍,劉航旭,李國(guó)棟,葛磊蛟

(1.國(guó)網(wǎng)天津市電力公司電力科學(xué)研究院, 天津市 300384;2.國(guó)網(wǎng)天津市電力公司,天津市 300010;3.國(guó)網(wǎng)天津市電力公司濱海供電分公司,天津市 300450;4.天津大學(xué)電氣自動(dòng)化與信息工程學(xué)院,天津市 300072)

0 引 言

智能配電網(wǎng)電力設(shè)備具有種類(lèi)繁雜、數(shù)量多、運(yùn)維難等特點(diǎn)[1],隨著電力系統(tǒng)的不斷發(fā)展以及智能電網(wǎng)建設(shè)的深化推進(jìn),電網(wǎng)企業(yè)數(shù)據(jù)庫(kù)中存儲(chǔ)的電力數(shù)據(jù)隨著智能電網(wǎng)的運(yùn)維呈現(xiàn)爆發(fā)式增長(zhǎng)[2]。這些數(shù)據(jù)通常以非機(jī)構(gòu)化數(shù)據(jù)如圖像、文本等形式存儲(chǔ)[3],蘊(yùn)含大量關(guān)于電網(wǎng)設(shè)備運(yùn)行狀態(tài)的信息[4]。通過(guò)對(duì)電力設(shè)備缺陷文本的深度挖掘,能夠?qū)崿F(xiàn)電網(wǎng)運(yùn)行狀態(tài)的實(shí)時(shí)監(jiān)測(cè)、故障定位及設(shè)備維修,為電網(wǎng)的可靠運(yùn)行提供指導(dǎo)[5]。

近年來(lái),電力數(shù)據(jù)挖掘雖然已成為研究熱點(diǎn),但真正得到挖掘并利用的數(shù)據(jù)卻很少[6],如何深度挖掘電力設(shè)備缺陷文本內(nèi)部信息,是電力設(shè)備精細(xì)化管理未來(lái)發(fā)展面臨的主要問(wèn)題。我國(guó)在電力設(shè)備缺陷文本挖掘方面的成果較少,面臨巨大挑戰(zhàn)。首先,電力設(shè)備相關(guān)信息以文本形式表示,往往含義模糊、計(jì)算機(jī)難以辨別;其次,電力領(lǐng)域具有專(zhuān)業(yè)性,無(wú)法直接應(yīng)用其他領(lǐng)域的文本挖掘方法;最后,隨著智能電網(wǎng)的高速發(fā)展,電力設(shè)備相關(guān)文本會(huì)變得更加復(fù)雜,當(dāng)前電力設(shè)備缺陷文本挖掘技術(shù)將不再適用。

本文基于現(xiàn)有研究成果,對(duì)該領(lǐng)域的發(fā)展方向以及主要方法進(jìn)行分析,并指出面臨的關(guān)鍵難題。首先,面向電力設(shè)備缺陷文本挖掘從4個(gè)方面進(jìn)行剖析:1) 電力設(shè)備缺陷文本錯(cuò)誤識(shí)別與質(zhì)量提升;2) 電力設(shè)備缺陷嚴(yán)重等級(jí)自動(dòng)分類(lèi);3) 電力設(shè)備缺陷細(xì)節(jié)提取;4) 電力設(shè)備健康狀態(tài)自動(dòng)評(píng)價(jià)。其次,結(jié)合相關(guān)文獻(xiàn)中的算例結(jié)果,對(duì)不同方法實(shí)現(xiàn)的效果進(jìn)行分析。最后,分析電力設(shè)備缺陷文本挖掘技術(shù)未來(lái)發(fā)展方向,以期為該領(lǐng)域的進(jìn)一步研究提供參考與借鑒。

1 電力設(shè)備缺陷文本深度挖掘技術(shù)

電力設(shè)備缺陷文本深度挖掘技術(shù)包含缺陷文本錯(cuò)誤識(shí)別與質(zhì)量提升、缺陷嚴(yán)重等級(jí)自動(dòng)分類(lèi)、缺陷細(xì)節(jié)提取和健康狀態(tài)自動(dòng)評(píng)價(jià)4個(gè)方面,如圖1所示。

圖1 電力設(shè)備缺陷文本深度挖掘技術(shù)示意圖Fig.1 Schematic diagram of text deep mining technology for power equipment defects

首先對(duì)缺陷文本進(jìn)行錯(cuò)誤識(shí)別與質(zhì)量提升,剔除文本記錄錯(cuò)誤、混雜等數(shù)據(jù),得到高質(zhì)量的缺陷文本數(shù)據(jù);進(jìn)而對(duì)設(shè)備缺陷嚴(yán)重等級(jí)進(jìn)行自動(dòng)分類(lèi),并提取缺陷細(xì)節(jié),進(jìn)行電力設(shè)備的全面態(tài)勢(shì)獲??;最后進(jìn)行健康狀態(tài)自動(dòng)評(píng)價(jià),實(shí)現(xiàn)電力設(shè)備未來(lái)態(tài)勢(shì)的預(yù)測(cè)。

2 缺陷文本錯(cuò)誤識(shí)別與質(zhì)量提升

隨著電力設(shè)備的日常運(yùn)維,電力設(shè)備缺陷文本在電力設(shè)備文本系統(tǒng)中大量累積[7],但由于電力設(shè)備數(shù)量龐大,缺陷種類(lèi)復(fù)雜,現(xiàn)有的規(guī)范[8]無(wú)法實(shí)現(xiàn)全面總結(jié);此外,由于缺陷文本的人為記錄特征,時(shí)常會(huì)出現(xiàn)由于記錄人員經(jīng)驗(yàn)不足導(dǎo)致的文本殘缺甚至錯(cuò)誤等現(xiàn)象[9],造成了缺陷文本挖掘的復(fù)雜性。因此,錯(cuò)誤識(shí)別與質(zhì)量提升是電力設(shè)備缺陷文本挖掘的關(guān)鍵技術(shù)之一。首先對(duì)電力設(shè)備缺陷文本進(jìn)行錯(cuò)誤識(shí)別,找到因錄入不規(guī)范、語(yǔ)病等原因?qū)е碌奈谋惧e(cuò)誤,進(jìn)而針對(duì)識(shí)別結(jié)果對(duì)其進(jìn)行矯正,實(shí)現(xiàn)質(zhì)量提升。

2.1 缺陷文本錯(cuò)誤識(shí)別

通過(guò)對(duì)電力設(shè)備缺陷文本的挖掘,識(shí)別電力設(shè)備缺陷文本的錯(cuò)誤,從而更加完整地記錄電力設(shè)備相關(guān)缺陷,為電力設(shè)備缺陷文本的質(zhì)量提升奠定基礎(chǔ)。我國(guó)對(duì)于文本錯(cuò)誤識(shí)別的研究開(kāi)始于20世紀(jì)90年代,起步較晚,對(duì)于電力設(shè)備缺陷文本領(lǐng)域的錯(cuò)誤識(shí)別相關(guān)研究較少。文獻(xiàn)[10]面向卷宗文本錯(cuò)誤識(shí)別構(gòu)建了查錯(cuò)模塊,對(duì)錄入的文本進(jìn)行搜索,找出語(yǔ)病、錯(cuò)別字等文本錯(cuò)誤并記錄位置。文中為了充分考慮語(yǔ)料庫(kù)不能完全涵蓋自然語(yǔ)言的局限性,將語(yǔ)料庫(kù)中的詞與識(shí)別文本進(jìn)行比對(duì),找出未登錄的疑似語(yǔ)病的詞字。進(jìn)而將疑似錯(cuò)誤與上下文的詞串結(jié)合,利用Kenlm模塊計(jì)算置信度值判斷正誤。然而針對(duì)電力設(shè)備缺陷記錄領(lǐng)域,文獻(xiàn)[10]所提方法并不適用。

現(xiàn)有針對(duì)電力設(shè)備缺陷文本的研究主要聚焦于電網(wǎng)公司中質(zhì)量欠佳的歷史缺陷文本,主要結(jié)合電力設(shè)備缺陷文本分類(lèi)規(guī)范,研究電網(wǎng)中各設(shè)備的缺陷矯正方法,以改善設(shè)備缺陷。對(duì)于新錄入信息管理系統(tǒng)中的缺陷文本,采用文本質(zhì)量評(píng)價(jià)方法對(duì)其存在的問(wèn)題進(jìn)行分析,通過(guò)缺陷文本質(zhì)量評(píng)價(jià)方法,對(duì)修正前后的缺陷文本記錄數(shù)據(jù)進(jìn)行打分,根據(jù)評(píng)分結(jié)果得到缺陷文本錯(cuò)誤識(shí)別結(jié)果。

為對(duì)大規(guī)模文本信息進(jìn)行深度分析,可借助知識(shí)圖譜(knowledge graph,KG)顯示知識(shí)之間相關(guān)聯(lián)系的能力[11],構(gòu)建電力設(shè)備缺陷文本知識(shí)圖譜實(shí)現(xiàn)檢索、查錯(cuò)等功能。知識(shí)圖譜是一種新型的圖型數(shù)據(jù)庫(kù),它通過(guò)“結(jié)點(diǎn)-關(guān)系-結(jié)點(diǎn)”的基本三元結(jié)構(gòu)表示知識(shí)之間的關(guān)系[12]。知識(shí)圖譜技術(shù)的發(fā)展有賴(lài)于人工智能的普及,它可以通過(guò)可視化的方式顯示人工智能的決策過(guò)程。在知識(shí)圖譜的分類(lèi)中,縱向知識(shí)圖譜指的是某一特定領(lǐng)域的知識(shí)圖譜。電力知識(shí)圖譜作為一種典型的縱向知識(shí)圖譜,已在電力工業(yè)的數(shù)據(jù)分析與決策環(huán)節(jié)得到了應(yīng)用。使用結(jié)構(gòu)化數(shù)據(jù)形式的電力設(shè)備缺陷文本構(gòu)造知識(shí)圖譜,便可實(shí)現(xiàn)輔助錄入系統(tǒng)所需要的數(shù)據(jù)檢索與可視化功能[13]。針對(duì)電力設(shè)備缺陷文本錯(cuò)誤識(shí)別,文獻(xiàn)[14]采用基于知識(shí)圖譜的缺陷文本錯(cuò)誤識(shí)別方法,提出了一種基于圖搜索的缺陷記錄檢索過(guò)程,通過(guò)深度優(yōu)先搜索算法實(shí)現(xiàn)對(duì)知識(shí)圖譜中完整樹(shù)的搜索,從而構(gòu)成完整的缺陷記錄,大大簡(jiǎn)化了工作人員分析文本的過(guò)程。該文獻(xiàn)最后以電網(wǎng)公司變壓器缺陷文本為例,將所提方法與基于機(jī)器學(xué)習(xí)的模型進(jìn)行對(duì)比,結(jié)合相關(guān)評(píng)價(jià)標(biāo)準(zhǔn)例如精確率、召回率等,證明了所提方法在提升缺陷文本錯(cuò)誤識(shí)別效果方面的有效性和優(yōu)越性。

上述圖搜索算法對(duì)于錯(cuò)誤識(shí)別具有良好的效果,但是容易因?yàn)榕R近搜索而陷入死循環(huán)。樹(shù)搜索算法在搜索問(wèn)題復(fù)雜度不高的情況下可以在不明顯犧牲搜索靈活度的前提下解決陷入死循環(huán)的問(wèn)題。因此樹(shù)搜索算法也可以用于解決缺陷文本錯(cuò)誤識(shí)別的難題。文獻(xiàn)[15]為提高缺陷分類(lèi)等級(jí)的準(zhǔn)確度,對(duì)缺陷文本中的錯(cuò)誤識(shí)別進(jìn)行了研究。首先輸入歷史記錄的設(shè)備缺陷文本,并根據(jù)國(guó)家電網(wǎng)有限公司給出的缺陷分類(lèi)標(biāo)準(zhǔn)構(gòu)建了樹(shù)路徑匹配框架。進(jìn)而按照樹(shù)路徑匹配算法找到對(duì)應(yīng)的最相似路徑,從而識(shí)別到文本錯(cuò)誤并給出錯(cuò)誤程度。這種基于樹(shù)搜索的識(shí)別模式與圖搜索類(lèi)似,但是區(qū)別在于前者允許經(jīng)過(guò)重復(fù)的節(jié)點(diǎn)而后者不允許。

由于關(guān)系提取的準(zhǔn)確性將直接影響知識(shí)圖譜[14]和樹(shù)結(jié)構(gòu)的準(zhǔn)確性和完整性,且現(xiàn)有的知識(shí)圖譜與樹(shù)結(jié)構(gòu)的表示主要是依賴(lài)電網(wǎng)公司的分類(lèi)標(biāo)準(zhǔn),隨著設(shè)備的多樣化以及運(yùn)行場(chǎng)景的復(fù)雜化,缺陷文本的錯(cuò)誤可能會(huì)被誤識(shí)別[15]。如果使用更多的語(yǔ)法解析等自然語(yǔ)言處理技術(shù)提取更多的語(yǔ)義特征,缺陷文本的錯(cuò)誤識(shí)別效果可進(jìn)一步提高。這也是未來(lái)缺陷文本錯(cuò)誤識(shí)別研究的一個(gè)可能方向。

2.2 缺陷文本質(zhì)量評(píng)價(jià)與提升

缺陷文本的質(zhì)量會(huì)影響深度挖掘的效果,因此高質(zhì)量的缺陷文本庫(kù)是對(duì)其深度挖掘的基礎(chǔ)。設(shè)備缺陷文本很大一部分由人工錄入,存在錄入不規(guī)范、語(yǔ)病等問(wèn)題,對(duì)缺陷文本進(jìn)行錯(cuò)誤識(shí)別后需要對(duì)其進(jìn)行質(zhì)量評(píng)價(jià)和提升。

機(jī)器學(xué)習(xí)與自然語(yǔ)言處理技術(shù)可以實(shí)現(xiàn)缺陷文本質(zhì)量的智能評(píng)價(jià)與提升[16]。文獻(xiàn)[17]將文本錯(cuò)誤的糾正問(wèn)題看作輸入數(shù)據(jù)的規(guī)范化翻譯過(guò)程,改變了傳統(tǒng)的文本錯(cuò)誤識(shí)別-質(zhì)量提升的二階段策略,運(yùn)用帶注意力機(jī)制的序列到序列學(xué)習(xí)模型對(duì)常規(guī)中文文本進(jìn)行了錯(cuò)誤糾正。這種文本提升方法需要大量的帶標(biāo)簽數(shù)據(jù)對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,對(duì)于電力設(shè)備缺陷文本專(zhuān)業(yè)領(lǐng)域的適用性不足,目前對(duì)電力設(shè)備缺陷文本質(zhì)量提升方面的研究較少。文獻(xiàn)[18]提出了一種缺陷文本質(zhì)量評(píng)價(jià)和提升方法,以電網(wǎng)中不同設(shè)備產(chǎn)生的25 000多條歷史缺陷文本為例,通過(guò)缺陷文本質(zhì)量評(píng)價(jià)方法,對(duì)修正前后的缺陷文本記錄數(shù)據(jù)進(jìn)行打分,根據(jù)打分評(píng)價(jià)結(jié)果,準(zhǔn)確識(shí)別新錄入文本存在的問(wèn)題并給出修改建議,完成新錄入缺陷文本質(zhì)量的提升,從而驗(yàn)證了所提方法在同時(shí)實(shí)現(xiàn)歷史缺陷文本與新錄入文本質(zhì)量評(píng)價(jià)與提升方面的有效性。

電力設(shè)備缺陷文本質(zhì)量提升過(guò)程主要有以下幾個(gè)步驟:首先,以電網(wǎng)公司缺陷文本為樣本,分析獲知電網(wǎng)公司缺陷文本存在的問(wèn)題,如格式殘缺、語(yǔ)義模糊、冗雜等問(wèn)題;然后,針對(duì)這些問(wèn)題,提出缺陷文本質(zhì)量評(píng)價(jià)指標(biāo),并以此構(gòu)建相關(guān)評(píng)分體系對(duì)缺陷文本進(jìn)行評(píng)價(jià);基于文本質(zhì)量評(píng)價(jià)結(jié)果,聚焦于電網(wǎng)公司中質(zhì)量欠佳的歷史缺陷文本,采用潛在多元Beta分布等方法,結(jié)合電力設(shè)備缺陷文本分類(lèi)規(guī)范,對(duì)文本內(nèi)容予以矯正;最后,針對(duì)新錄入信息管理系統(tǒng)中的缺陷文本,采用上述文本質(zhì)量評(píng)價(jià)方法對(duì)其存在的問(wèn)題進(jìn)行分析,從而給出修正建議。

然而,目前的缺陷文本質(zhì)量評(píng)價(jià)方法存在很強(qiáng)的主觀(guān)性[18],隨著缺陷文本數(shù)據(jù)量的增加可能出現(xiàn)評(píng)價(jià)與實(shí)際質(zhì)量偏差過(guò)大的情況影響質(zhì)量提升效果。因此,基于客觀(guān)評(píng)價(jià)結(jié)果建立缺陷文本質(zhì)量量化模型是未來(lái)缺陷文本質(zhì)量提升的重要方向。

3 缺陷文本缺陷嚴(yán)重等級(jí)自動(dòng)分類(lèi)

在電力系統(tǒng)巡檢過(guò)程中,往往會(huì)累積大量缺陷文本,這些缺陷文本中記錄著大量關(guān)于設(shè)備缺陷嚴(yán)重等級(jí)的相關(guān)信息,對(duì)設(shè)備缺陷等級(jí)的分類(lèi)至關(guān)重要。通過(guò)分類(lèi)設(shè)備缺陷嚴(yán)重等級(jí),工作人員可以更好地實(shí)現(xiàn)對(duì)電力系統(tǒng)中缺陷設(shè)備的管理。然而傳統(tǒng)的設(shè)備缺陷嚴(yán)重等級(jí)分類(lèi)方法往往需要人工完成,其分類(lèi)效率低下;且針對(duì)模糊性較強(qiáng)的亞健康缺陷,往往會(huì)出現(xiàn)由于巡檢人員經(jīng)驗(yàn)不足而分類(lèi)不精確的情況,對(duì)電力設(shè)備運(yùn)行狀態(tài)的評(píng)估產(chǎn)生不利影響。

隨著人工智能及模式識(shí)別的深度開(kāi)發(fā),多種機(jī)器學(xué)習(xí)模型與電力設(shè)備缺陷嚴(yán)重等級(jí)分類(lèi)相結(jié)合[19],既能夠提高電力設(shè)備缺陷嚴(yán)重等級(jí)分類(lèi)的效率[20],又能夠避免因信息模糊造成的分類(lèi)精確率降低。文獻(xiàn)[21]針對(duì)缺陷文本分類(lèi),首先通過(guò)one-hot詞袋模型對(duì)缺陷文本進(jìn)行預(yù)處理,實(shí)現(xiàn)了向量空間的構(gòu)建及缺陷嚴(yán)重等級(jí)的分類(lèi)與量化;接著采用K最近鄰算法對(duì)電力設(shè)備缺陷記錄數(shù)據(jù)完成類(lèi)別辨識(shí)。仿真部分以斷路器缺陷文本為例,對(duì)缺陷文本進(jìn)行重新分類(lèi),與初始結(jié)果進(jìn)行對(duì)比可得,該方法準(zhǔn)確率更高,驗(yàn)證了所提方法的可行性。

機(jī)器學(xué)習(xí)與智能識(shí)別的應(yīng)用,使得分類(lèi)效率大大提高。但這類(lèi)分類(lèi)方法往往需要依靠特征函數(shù),從而導(dǎo)致特征項(xiàng)模糊甚至丟失[22];此外,傳統(tǒng)機(jī)器學(xué)習(xí)分類(lèi)方法的泛化能力以及數(shù)據(jù)挖掘能力有限,從而大大限制了缺陷文本的分類(lèi)效果。

為解決上述問(wèn)題,基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的電力設(shè)備缺陷文本挖掘算法被提出,通過(guò)卷積運(yùn)算實(shí)現(xiàn)特征壓縮降維、減小運(yùn)算量[23]。文獻(xiàn)[19]通過(guò)與多種傳統(tǒng)機(jī)器學(xué)習(xí)分類(lèi)模型對(duì)比得出:基于CNN的缺陷文本分類(lèi)模型在耗費(fèi)一定時(shí)間的前提下,顯著降低了缺陷文本分類(lèi)的錯(cuò)誤率;此外,與以往的機(jī)器學(xué)習(xí)分類(lèi)法相比,基于CNN的缺陷文本分類(lèi)模型分類(lèi)時(shí)間較短,提高了分類(lèi)效率。但是該方法僅對(duì)文本進(jìn)行了一次串行淺層特征提取,不能很好地挖掘長(zhǎng)文本深層語(yǔ)義信息。針對(duì)CNN無(wú)法對(duì)長(zhǎng)序列信息建模的問(wèn)題,應(yīng)用循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(recurrent convolutional neural network,RCNN)是解決該問(wèn)題的可行思路。RCNN是基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的改進(jìn)算法,克服了傳統(tǒng)RNN長(zhǎng)期依賴(lài)、梯度爆炸的問(wèn)題[24]。文獻(xiàn)[25]以變壓器為研究對(duì)象,運(yùn)用RCNN模型完成對(duì)缺陷文本的自動(dòng)分類(lèi)。仿真部分基于變壓器運(yùn)維文本,將RCNN方法分別與傳統(tǒng)文本分類(lèi)模型、RNN以及CNN方法進(jìn)行對(duì)比。與傳統(tǒng)中文文本分類(lèi)方法相比,RCNN同時(shí)實(shí)現(xiàn)了特征提取與分類(lèi)評(píng)估,可直接面向底層進(jìn)行語(yǔ)義分析,分類(lèi)性能提升了3.49%~21.0%;相比于CNN、RNN,RCNN 模型網(wǎng)絡(luò)框架更加優(yōu)秀,可更好地融合上下文信息并最大可能保留關(guān)鍵語(yǔ)義。

文獻(xiàn)[26]采用基于雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(bi-long short term memory, BiLSTM)的分類(lèi)模型實(shí)現(xiàn)對(duì)缺陷文本缺陷嚴(yán)重等級(jí)高效自動(dòng)分類(lèi)。選取經(jīng)過(guò)人工分類(lèi)的某電網(wǎng)公司2010—2015年的529個(gè)故障文本中的900條句子作為輸入數(shù)據(jù),輸出為設(shè)備故障嚴(yán)重等級(jí)。仿真部分通過(guò)分類(lèi)準(zhǔn)確率、召回率以及F1值3個(gè)指標(biāo)對(duì)BiLSTM方法與LSTM及CNN方法進(jìn)行比較,驗(yàn)證了BiLSTM方法的優(yōu)越性。文獻(xiàn)[27]在BiLSTM的基礎(chǔ)上引入了注意力機(jī)制,提出了基于注意力機(jī)制的雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM based on attention mechanism, BiLSTM-Attention)缺陷文本分類(lèi)方法。相比于傳統(tǒng)文本分類(lèi)模型、BiLSTM模型以及CNN模型,BiLSTM-Attention模型在電力設(shè)備缺陷文本分類(lèi)中具有更好的分類(lèi)性能,提高了對(duì)含有混淆信息長(zhǎng)文本的特征提取能力和分類(lèi)能力。關(guān)于電力設(shè)備缺陷文本缺陷嚴(yán)重等級(jí)自動(dòng)分類(lèi)的方法如圖2和表1所示。

表1 現(xiàn)有缺陷文本缺陷嚴(yán)重等級(jí)自動(dòng)分類(lèi)方法特點(diǎn)對(duì)比Table 1 Comparison of characteristics of existing automatic classification methods for defect severity level of defect text

圖2 缺陷文本缺陷嚴(yán)重等級(jí)自動(dòng)分類(lèi)方法Fig.2 Automatic classification method for defect severity level in defect text

4 缺陷文本缺陷細(xì)節(jié)提取

電力公司在電力設(shè)備的日常運(yùn)營(yíng)巡檢中,通常以非結(jié)構(gòu)化數(shù)據(jù)形式將電力設(shè)備的異常和維護(hù)等信息錄入管理系統(tǒng),數(shù)據(jù)形式以文本形式為主。這些信息中存在著大量的設(shè)備相關(guān)運(yùn)行狀態(tài)信息,同時(shí)還表征了其他同類(lèi)設(shè)備的運(yùn)行可靠性信息[28]。然而通過(guò)對(duì)大量缺陷文本信息的研究能夠發(fā)現(xiàn),同一設(shè)備多個(gè)零件的缺陷情況經(jīng)常存在于一條缺陷文本信息中,過(guò)度且復(fù)雜的描述導(dǎo)致信息記錄錯(cuò)亂無(wú)序。通過(guò)對(duì)缺陷記錄中缺陷細(xì)節(jié)的提取,可以實(shí)現(xiàn)缺陷情況的精確統(tǒng)計(jì)、高效分析與有效評(píng)價(jià)。因此,缺陷文本中缺陷細(xì)節(jié)的提取是確保電力系統(tǒng)安全運(yùn)行的關(guān)鍵環(huán)節(jié)[29]。自然語(yǔ)言處理(nature language processing, NLP)技術(shù)是一門(mén)融合語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué),可以實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信,在一定程度實(shí)現(xiàn)人機(jī)交互。為此,基于NLP領(lǐng)域中的多種方法被廣泛應(yīng)用到中文電力設(shè)備缺陷文本細(xì)節(jié)提取中。目前電力設(shè)備缺陷文本細(xì)節(jié)提取按自然語(yǔ)言不同主要可分為英文電力設(shè)備缺陷文本細(xì)節(jié)提取和中文電力設(shè)備缺陷文本細(xì)節(jié)提取2個(gè)方向。

文獻(xiàn)[30]以紐約市電力系統(tǒng)相關(guān)信息作為參考,提出了一種基于機(jī)器學(xué)習(xí)的海量缺陷歷史數(shù)據(jù)挖掘方法,電力公司通過(guò)該模型可以確定維護(hù)和維修工作的優(yōu)先級(jí),例如:1)對(duì)饋線(xiàn)故障維修的優(yōu)先等級(jí);2)對(duì)電纜、接頭、終端以及變壓器等故障維修的優(yōu)先等級(jí)。該方法為電網(wǎng)公司提供了電力設(shè)備故障預(yù)測(cè)以及預(yù)防性維修的依據(jù),從而實(shí)現(xiàn)對(duì)電網(wǎng)更好的維護(hù)。國(guó)外的缺陷文本細(xì)節(jié)提取研究主要聚焦于英文文本,然而與之相比,中文文本在構(gòu)詞、詞性等方面存在著較大差異,因此英文文本挖掘的相關(guān)算法研究在中文文本中是不適用的。文獻(xiàn)[31]提出一種基于語(yǔ)義框架的電力設(shè)備缺陷文本缺陷細(xì)節(jié)提取方法,為電力設(shè)備缺陷的進(jìn)一步記錄、管理奠定了基礎(chǔ)。首先,建立本體字典庫(kù);接著通過(guò)對(duì)電力設(shè)備缺陷記錄數(shù)據(jù)的總結(jié)分析,結(jié)合其固有特點(diǎn)實(shí)現(xiàn)了電力語(yǔ)義框架與語(yǔ)義槽的建立;采用槽填充并構(gòu)建語(yǔ)義框架,構(gòu)建流程如圖3所示。通過(guò)對(duì)大量變壓器缺陷文本的處理,驗(yàn)證了該方法能夠精確提取電力設(shè)備缺陷文本中的缺陷信息,因此也能夠應(yīng)用于電力設(shè)備缺陷統(tǒng)計(jì)與分類(lèi)中。文獻(xiàn)[32]結(jié)合依存句法分析技術(shù)對(duì)電力設(shè)備缺陷文本信息的精確辨識(shí)方法進(jìn)行了改進(jìn)。首先,基于依存句法分析技術(shù),構(gòu)建了電力設(shè)備缺陷文本與電力設(shè)備標(biāo)準(zhǔn)文本的依存句法樹(shù),依存句法樹(shù)生成流程如圖4所示。接著運(yùn)用依存句法的樹(shù)匹配算法實(shí)現(xiàn)了電力設(shè)備缺陷細(xì)節(jié)數(shù)據(jù)的準(zhǔn)確分析與分類(lèi)。最后以主變壓器為研究對(duì)象,通過(guò)分析其歷史缺陷文本記錄,證明了該方法的優(yōu)越性和實(shí)用性,相比于其他方法,該方法的計(jì)算速度與精確度更具有優(yōu)越性。

圖3 構(gòu)建語(yǔ)義框架流程Fig.3 Semantic for framework construction

圖4 電力設(shè)備文本依存句法樹(shù)生成流程Fig.4 Flowchart of constructing dependency syntax tree based on equipment defect text

5 缺陷文本健康狀態(tài)自動(dòng)評(píng)價(jià)

在電力設(shè)備日常運(yùn)行巡檢中,產(chǎn)生的缺陷文本除了包含電力設(shè)備當(dāng)前的缺陷情況外,還蘊(yùn)藏著豐富的電力設(shè)備健康狀態(tài)歷史記錄,通過(guò)對(duì)健康狀態(tài)的歷史記錄進(jìn)行分析,能夠更好地評(píng)價(jià)設(shè)備運(yùn)行狀態(tài),從而實(shí)現(xiàn)對(duì)電力設(shè)備未來(lái)態(tài)勢(shì)的預(yù)測(cè)。

當(dāng)前健康狀態(tài)主要評(píng)價(jià)方法如下所述:1) 基于評(píng)價(jià)導(dǎo)則與專(zhuān)家系統(tǒng)的方法,這種方法成本高、耗時(shí)長(zhǎng),當(dāng)面對(duì)大量設(shè)備健康狀態(tài)評(píng)價(jià)時(shí),難以滿(mǎn)足需求[33];2) 基于人工智能技術(shù)構(gòu)建神經(jīng)網(wǎng)絡(luò)等模型的方法,這種方法是目前的主流方法,能夠?qū)崿F(xiàn)大量設(shè)備健康狀態(tài)的評(píng)價(jià)[34-37]。

文獻(xiàn)[34]提出了一種比率型斷路器全壽命周期運(yùn)行狀況評(píng)價(jià)模型。首先,根據(jù)斷路器缺陷等級(jí),結(jié)合文本挖掘技術(shù)和相關(guān)評(píng)價(jià)規(guī)范[35]得到缺陷等級(jí)評(píng)價(jià)結(jié)果,將評(píng)價(jià)結(jié)果量化為健康狀態(tài)指數(shù);接著運(yùn)用比率型狀態(tài)信息融合模型得到單位健康周期健康狀態(tài)指數(shù),將其與之前得到的健康狀態(tài)指數(shù)結(jié)合,得到了全壽命周期數(shù)據(jù)流,從而得到斷路器全壽命周期運(yùn)行狀況評(píng)價(jià)模型。文獻(xiàn)[36]表明,結(jié)合全壽命狀態(tài)評(píng)價(jià)模型,可從電力設(shè)備缺陷文本中的語(yǔ)句結(jié)構(gòu)和語(yǔ)義對(duì)電力設(shè)備缺陷文本進(jìn)行深層次挖掘,通過(guò)對(duì)比缺陷文本與電力設(shè)備缺陷評(píng)價(jià)規(guī)范,給出當(dāng)時(shí)情景下的電力設(shè)備健康評(píng)價(jià)結(jié)果,從而極大改善了電力設(shè)備健康狀態(tài)評(píng)估的客觀(guān)性與準(zhǔn)確性。文獻(xiàn)[37]以電力系統(tǒng)故障的告警信號(hào)為研究對(duì)象,提出了一種電力調(diào)度故障自動(dòng)判斷模型。首先,結(jié)合隱馬爾可夫模型及向量空間模型對(duì)調(diào)度故障信息進(jìn)行預(yù)處理;接著基于對(duì)故障信息文本的辨識(shí)結(jié)果,實(shí)現(xiàn)對(duì)故障情況的精確診斷,并通過(guò)k-means聚類(lèi)法獲取高概率故障為運(yùn)維人員提供運(yùn)維檢修依據(jù)。

現(xiàn)有的基于缺陷詞庫(kù)的電力設(shè)備健康狀態(tài)評(píng)估方法[30],普遍存在以下缺陷:由于樣本較少,經(jīng)過(guò)模型訓(xùn)練所得到的結(jié)果往往并不精確,難以覆蓋所有缺陷,缺陷文本錄入不規(guī)范也會(huì)限制電力設(shè)備健康狀態(tài)評(píng)估方法的準(zhǔn)確性。因此,通過(guò)對(duì)電力設(shè)備缺陷文本深度挖掘來(lái)提高缺陷類(lèi)型評(píng)估準(zhǔn)確性的方法[36]存在固有局限性,需要先對(duì)缺陷文本進(jìn)行質(zhì)量提升。此外,基于機(jī)器學(xué)習(xí)的健康狀態(tài)評(píng)估方法的核心是實(shí)際需要故障類(lèi)型對(duì)訓(xùn)練的故障樣本具有高度依賴(lài)性,對(duì)于故障樣本未包含的故障類(lèi)型,難以進(jìn)行精準(zhǔn)識(shí)別,通過(guò)生成對(duì)抗網(wǎng)絡(luò)來(lái)生成原本故障樣本未包含的數(shù)據(jù)是一種數(shù)據(jù)增強(qiáng)的有效手段。此外,深度學(xué)習(xí)等機(jī)器學(xué)習(xí)算法需要大量的有標(biāo)簽數(shù)據(jù)作為數(shù)據(jù)支撐,當(dāng)訓(xùn)練數(shù)據(jù)匱乏時(shí),訓(xùn)練出的模型極易出現(xiàn)過(guò)擬合的現(xiàn)象,這種現(xiàn)象在小規(guī)模數(shù)據(jù)集上尤為明顯。未來(lái),通過(guò)人工智能技術(shù)提高訓(xùn)練樣本集完備性以加強(qiáng)故障類(lèi)型識(shí)別精度值得深入研究。

6 電力設(shè)備缺陷文本信息挖掘前景展望

目前電力設(shè)備缺陷文本挖掘領(lǐng)域仍然處于初級(jí)階段,對(duì)文本挖掘技術(shù)有待進(jìn)一步研究。本文基于目前的研究成果,對(duì)電力設(shè)備缺陷文本挖掘技術(shù)進(jìn)行了總結(jié),其未來(lái)關(guān)鍵技術(shù)發(fā)展前景展望如下:

1) 高質(zhì)量電力本體詞典的構(gòu)建。電力本體詞典是電力設(shè)備缺陷文本挖掘技術(shù)的基礎(chǔ)[36],其質(zhì)量決定了電力設(shè)備缺陷文本挖掘的效果。受制于電力領(lǐng)域方向眾多、詞匯復(fù)雜等因素,構(gòu)建高質(zhì)量電力本體詞典困難,如何通過(guò)相關(guān)方法構(gòu)建高質(zhì)量電力本體詞典,是今后研究的關(guān)鍵問(wèn)題。目前電力本體詞典的構(gòu)建主要針對(duì)非結(jié)構(gòu)化的文本數(shù)據(jù),如果能與結(jié)構(gòu)化的多源數(shù)據(jù)進(jìn)行融合,結(jié)合專(zhuān)家系統(tǒng)對(duì)電力本體詞典進(jìn)行實(shí)時(shí)在線(xiàn)擴(kuò)充,將會(huì)極大消除電力設(shè)備缺陷文本挖掘?qū)τ谖粗毕莸奶卣魑谋咎崛±щy的現(xiàn)狀。

2) 知識(shí)圖譜在電力設(shè)備缺陷文本信息提取中的深層次應(yīng)用。當(dāng)前電力知識(shí)圖譜的研究不夠深入,在其內(nèi)部架構(gòu)設(shè)計(jì)方面有待進(jìn)一步研究[38]。文獻(xiàn)[39]所提出的電力知識(shí)圖譜主要采用三元組的形式進(jìn)行表示,難以表示更加復(fù)雜的電力設(shè)備缺陷文本信息。因此,如何進(jìn)一步開(kāi)發(fā)知識(shí)圖譜,使其能夠更加詳細(xì)地表達(dá)復(fù)雜信息,是電力知識(shí)圖譜在電力設(shè)備缺陷文本挖掘中的重要研究方向;此外,電力知識(shí)圖譜構(gòu)建過(guò)程中,如何更加準(zhǔn)確地獲取大量有效知識(shí)以及如何更好對(duì)知識(shí)進(jìn)行有效融合,是電力知識(shí)圖譜應(yīng)用的另一關(guān)鍵問(wèn)題。知識(shí)圖譜具有良好的解釋性,而基于深度學(xué)習(xí)的特征提取方法具有精準(zhǔn)度高解釋性差的特點(diǎn),因此可以將二者結(jié)合,構(gòu)建基于深度學(xué)習(xí)的新型知識(shí)圖譜,將深度學(xué)習(xí)的輸出結(jié)果轉(zhuǎn)化為知識(shí)圖譜可以理解的三元組進(jìn)行推理,在保證缺陷文本提取合理性的基礎(chǔ)上提高提取精度與效率。

3) 電力設(shè)備缺陷文本細(xì)節(jié)提取方法的深度開(kāi)發(fā)[40]。當(dāng)前電力設(shè)備缺陷文本細(xì)節(jié)提取方法仍較為簡(jiǎn)單,可以通過(guò)篩選進(jìn)一步完善。如利用神經(jīng)網(wǎng)絡(luò)的分類(lèi)功能對(duì)不同數(shù)據(jù)進(jìn)行篩選,有效降低非強(qiáng)關(guān)聯(lián)數(shù)據(jù)對(duì)提取結(jié)果的影響,改善細(xì)節(jié)提取原始數(shù)據(jù)集的質(zhì)量。

4)多源數(shù)據(jù)融合在電力設(shè)備缺陷文本挖掘方法中的應(yīng)用。當(dāng)前依靠缺陷文本挖掘與自動(dòng)診斷技術(shù)的應(yīng)用對(duì)電力設(shè)備健康狀態(tài)自動(dòng)評(píng)價(jià)的方法只是基于歷史缺陷記錄數(shù)據(jù)對(duì)設(shè)備當(dāng)前運(yùn)行態(tài)勢(shì)進(jìn)行評(píng)價(jià),如何將設(shè)備運(yùn)行實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)與健康狀態(tài)評(píng)價(jià)模型相結(jié)合,實(shí)現(xiàn)電力設(shè)備健康狀態(tài)完整評(píng)價(jià),仍需要進(jìn)一步研究。例如針對(duì)多源數(shù)據(jù)融合接入進(jìn)行綜合分析處理,實(shí)時(shí)融合機(jī)器人等站端各類(lèi)智能裝備在線(xiàn)數(shù)據(jù)和離線(xiàn)監(jiān)測(cè)數(shù)據(jù)等信息;進(jìn)而依托設(shè)備健康狀態(tài)評(píng)價(jià)算法模型進(jìn)行設(shè)備運(yùn)行狀態(tài)評(píng)估;最后結(jié)合專(zhuān)家系統(tǒng)中的知識(shí)庫(kù)、規(guī)則庫(kù)實(shí)現(xiàn)智能預(yù)警,并與智能裝備調(diào)度平臺(tái)進(jìn)行聯(lián)動(dòng)控制,實(shí)現(xiàn)一體化、全方位的數(shù)字化和智能化設(shè)備健康狀態(tài)評(píng)估。

7 結(jié) 論

本文主要從技術(shù)角度探討了電力設(shè)備缺陷文本錯(cuò)誤識(shí)別與質(zhì)量提升、嚴(yán)重等級(jí)自動(dòng)分類(lèi)、缺陷細(xì)節(jié)提取、健康狀態(tài)自動(dòng)評(píng)價(jià)等關(guān)鍵技術(shù)。本文研究的內(nèi)容,是基于該領(lǐng)域已有科研成果所作的總結(jié)和展望,以期對(duì)電力設(shè)備缺陷文本挖掘技術(shù)的進(jìn)一步發(fā)展及應(yīng)用提供一些思路和借鑒。然而配電網(wǎng)作為輸電端與負(fù)荷端連接的關(guān)鍵系統(tǒng),具有設(shè)備復(fù)雜、傳感器種類(lèi)多樣、新舊程度不一等特點(diǎn)。在應(yīng)用層面,由于運(yùn)行環(huán)境惡劣、電磁干擾,許多設(shè)備狀態(tài)監(jiān)測(cè)裝置現(xiàn)場(chǎng)應(yīng)用性能不穩(wěn)定,監(jiān)測(cè)裝置本身存在故障率、誤報(bào)率高及數(shù)據(jù)可信度存疑等問(wèn)題,電力設(shè)備缺陷文本智能辨識(shí)技術(shù)在配電設(shè)備智能高效運(yùn)維的實(shí)際工程應(yīng)用面臨嚴(yán)峻挑戰(zhàn)。通過(guò)建立基于人工智能的電力設(shè)備缺陷文本分類(lèi)模型,對(duì)現(xiàn)場(chǎng)巡視人員錄入的缺陷文本數(shù)據(jù)進(jìn)行等級(jí)分類(lèi)并給出相關(guān)分類(lèi)依據(jù)可有效提升電力設(shè)備運(yùn)維效率。此外,電力設(shè)備缺陷文本挖掘技術(shù)的發(fā)展仍然需要相當(dāng)長(zhǎng)的過(guò)程,在當(dāng)前研究的基礎(chǔ)上,應(yīng)融合多種方法實(shí)現(xiàn)電力設(shè)備缺陷文本挖掘,以期實(shí)現(xiàn)更加智能的效果。

猜你喜歡
電力設(shè)備圖譜錯(cuò)誤
在錯(cuò)誤中成長(zhǎng)
繪一張成長(zhǎng)圖譜
加強(qiáng)電力設(shè)備運(yùn)維云平臺(tái)安全性管理
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
電力設(shè)備運(yùn)維管理及安全運(yùn)行探析
主動(dòng)對(duì)接你思維的知識(shí)圖譜
基于壓縮感知的電力設(shè)備視頻圖像去噪方法研究
不犯同樣錯(cuò)誤
基于改進(jìn)Canny算子的電力設(shè)備圖像檢測(cè)研究
《錯(cuò)誤》:怎一個(gè)“美”字了得
潍坊市| 永平县| 原平市| 文登市| 安达市| 永泰县| 靖州| 广州市| 太原市| 吉安市| 金堂县| 柳河县| 商丘市| 吉首市| 云林县| 五河县| 祁阳县| 洪湖市| 南阳市| 石台县| 含山县| 武夷山市| 蓬安县| 东明县| 二手房| 大厂| 潢川县| 巴林左旗| 高阳县| 荥经县| 东光县| 澄迈县| 营口市| 高密市| 万源市| 彩票| 泗阳县| 青阳县| 平阴县| 双城市| 台北市|