袁 奇,鄒翔宇,梅珊珊,孫偉莎,沈 斌,樂保羅,劉 暢
(國(guó)網(wǎng)上海市電力公司電纜分公司,上海 200072)
隨著電網(wǎng)負(fù)荷的日益增長(zhǎng)及城市化水平的不斷升高,空間占用率更低、安全性更高的電力電纜成為城區(qū)電網(wǎng)的主要架構(gòu)[1]。截至2020年底,上海電網(wǎng)在運(yùn)行110 kV及以上電壓等級(jí)電纜回路為1 900余回,電纜總長(zhǎng)度已超過3 800 km,研究如何保障中高壓電纜線路的安全運(yùn)行已然成為電網(wǎng)運(yùn)維工作的重要內(nèi)容。
雖然電纜系統(tǒng)故障率遠(yuǎn)低于架空線路,但是電力電纜附件敷設(shè)通道狹窄,并且電纜設(shè)備大多位于市中心區(qū)域,當(dāng)設(shè)備出現(xiàn)意外故障時(shí),故障排查定位困難、修復(fù)用時(shí)長(zhǎng)、修復(fù)難度大,造成的損失遠(yuǎn)大于架空線路[2]。近年來,因市政工程中的不當(dāng)操作引起的高壓電纜設(shè)備故障大量出現(xiàn),引發(fā)了爆炸、火災(zāi)等重大事件[3]。據(jù)統(tǒng)計(jì),2020年因安裝工藝導(dǎo)致的高壓電纜故障占比達(dá)35%,對(duì)電網(wǎng)的安全運(yùn)行帶來一定風(fēng)險(xiǎn)。為了減少電力故障,需要將安全防線前移,在電纜敷設(shè)安裝過程中嚴(yán)格管控施工質(zhì)量,尤其是管控電纜終端、接頭處的附件安裝工藝。
高壓電纜附件的安裝步驟主要以工藝圖紙的形式呈現(xiàn),經(jīng)過嚴(yán)格審查后獲得許可的工藝圖紙是電纜公司施工監(jiān)督的重要憑證。高壓電纜附件的生產(chǎn)廠家眾多,電纜附件種類繁多,各廠家生產(chǎn)出的同批次電纜附件依然存在質(zhì)量參差不齊的可能性;大量高壓電纜附件在未經(jīng)長(zhǎng)期運(yùn)行數(shù)據(jù)驗(yàn)證其可靠性的同時(shí),多次發(fā)現(xiàn)一些廠家附件安裝工藝在電纜公司未告知電纜公司情況下變更了工藝,對(duì)后期運(yùn)行帶來安全隱患;由于沒有形成各廠家附件安裝工藝庫(kù),導(dǎo)致圖紙比對(duì)無標(biāo)準(zhǔn),人工審核工作量巨大且容易出現(xiàn)漏查情況。
本文從簽訂技術(shù)協(xié)議的源頭上進(jìn)行管控和把關(guān),建立高壓電纜附件圖紙的數(shù)字標(biāo)準(zhǔn)化工藝庫(kù),收集各廠商電纜附件圖紙掃描成像后作為標(biāo)準(zhǔn)附件安裝工藝數(shù)據(jù)庫(kù);開發(fā)具有圖像特征識(shí)別技術(shù)、光學(xué)字符識(shí)別(Optical Character Recognition,簡(jiǎn)稱OCR)和一致性檢測(cè)算法功能的指紋識(shí)別系統(tǒng)。在施工過程中,可將高壓電纜附件安裝工藝進(jìn)行圖像識(shí)別,與數(shù)據(jù)庫(kù)中的圖像進(jìn)行比對(duì),從而快速識(shí)別出施工圖紙與數(shù)據(jù)庫(kù)中標(biāo)準(zhǔn)圖紙的差異信息,消除非標(biāo)準(zhǔn)工藝圖紙帶來的安全隱患。
本文主要使用圖像識(shí)別技術(shù)、OCR技術(shù)以及一致性檢測(cè)算法,通過高清掃描設(shè)備采用光電技術(shù)和數(shù)字處理技術(shù)對(duì)高壓電纜圖紙、技術(shù)協(xié)議等工藝圖掃描后進(jìn)入工藝庫(kù),將電子版工藝圖紙或工藝文檔進(jìn)行特征提取和字符識(shí)別、與標(biāo)準(zhǔn)工藝庫(kù)里固化的廠家模板圖紙進(jìn)行比對(duì);最終系統(tǒng)根據(jù)算法判斷比對(duì)的結(jié)果從而形成比對(duì)報(bào)告,主要針對(duì)在不同廠家的高壓電纜附件工藝圖紙或文檔上的修改情形進(jìn)行分析,對(duì)圖紙的刪除、新增和修改部分進(jìn)行系統(tǒng)提示,簡(jiǎn)化設(shè)計(jì)審核人員比對(duì)審核圖紙的過程,減少錯(cuò)漏現(xiàn)象,提高工作效率。
在高壓電纜附件數(shù)字化工藝庫(kù)中的圖像特征識(shí)別技術(shù)中,主要涉及到局部二值模式(LBP)算法和方向梯度直方圖(HOG)算法等特征抽取及邊緣檢測(cè)算法。在本系統(tǒng)中整個(gè)圖像識(shí)別部分的流程包含圖像預(yù)處理(圖像降噪、圖像增強(qiáng))、圖像復(fù)原(重建圖像,恢復(fù)圖像)、圖像編碼與壓縮、圖像分割(劃分不同特征的區(qū)域)以及最終的識(shí)別。識(shí)別流程如圖1所示。
圖1 識(shí)別流程
LBP是一種特征描述的經(jīng)典算法[4],廣泛應(yīng)用于圖像分析領(lǐng)域,該算子不僅能捕獲豐富的細(xì)節(jié)信息,而且能壓縮冗余信息。當(dāng)這種LBP算法的半徑太大時(shí),噪聲的敏感度就會(huì)加強(qiáng)。HOG的主要目的是將已經(jīng)進(jìn)行過統(tǒng)一、灰度處理工作的工藝圖紙單元進(jìn)行梯度計(jì)算,統(tǒng)計(jì)圖像的梯度信息,將圖像劃分成小的細(xì)胞單元形成每張圖紙獨(dú)有的HOG特征[5],從而實(shí)現(xiàn)后續(xù)圖紙的比對(duì)。
基于高壓電纜工藝化圖紙本身復(fù)雜的特性,如對(duì)比度、顏色、密度分布的方法都具有局限性,為了獲取更好的特征抽取和分類結(jié)果,深入研究現(xiàn)有的LBP算法。針對(duì)原算法的不足,利用全局及局部的像素灰度均差來決定自適應(yīng)閾值的大小,讓數(shù)字化工藝庫(kù)系統(tǒng)對(duì)工藝圖紙的圖紙識(shí)別有較強(qiáng)的自適性。
本文運(yùn)用自適應(yīng)模式的LBP算法將窗口大小的值與基礎(chǔ)LBP算法相結(jié)合,具有自適應(yīng)分析特征的性能。窗口大小的值由水平和垂直方向的平均強(qiáng)度差來決定。
假設(shè)圖像為g(x,y),計(jì)算大小為(2k+1)×(2k+1)的活動(dòng)窗口中的像素平均強(qiáng)度值:
(1)
對(duì)于工藝圖像中的每一個(gè)像素,分別計(jì)算它在水平和垂直方向上互不重疊的窗口之間的像素平均強(qiáng)度差:
(2)
對(duì)于每一個(gè)像素,能使Ek,h(x,y)或Ek,v(x,y)值達(dá)到最大(無論方向)的k值用來設(shè)置最佳尺寸:
Sbest(x,y)=2k+1
(3)
由此可知,Sbest(x,y)即為以(x,y)為坐標(biāo)的像素點(diǎn)的特征基元近似大小。該尺寸與LBP算法的結(jié)合,減少了LBP在基元特征提取上的誤差。
圖片的字符識(shí)別過程是一整套流程,它包括圖片分析、預(yù)處理、字符識(shí)別和識(shí)別矯正等,每個(gè)步驟都關(guān)系著最終識(shí)別結(jié)果的準(zhǔn)確性。比如要進(jìn)行字符識(shí)別的圖片越清晰(即預(yù)處理做的越好),識(shí)別效果往往就越好。字符識(shí)別是圖片的字符識(shí)別過程中最重要的環(huán)節(jié)。目前最廣泛使用的字符識(shí)別技術(shù)是OCR。OCR是針對(duì)印刷體字符,采用光學(xué)識(shí)別的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白單元構(gòu)建的圖像,并通過識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)[6]。
在OCR識(shí)別過程中主要分為4個(gè)部分。
(1)圖片預(yù)處理。該模塊的功能主要是將樣本圖片進(jìn)行尺寸統(tǒng)一、分割、灰度化和二值化等預(yù)處理,為后續(xù)的字符識(shí)別做準(zhǔn)備。
(2)訓(xùn)練字庫(kù)。利用OCR的開源引擎對(duì)目標(biāo)工藝圖片里的特征字符進(jìn)行,以提高識(shí)別準(zhǔn)確率。
(3)字符識(shí)別。利用開源OCR識(shí)別引擎對(duì)圖片進(jìn)行字符識(shí)別。在系統(tǒng)中實(shí)現(xiàn)對(duì)一張圖片的字符識(shí)別只需調(diào)用Pytesseract庫(kù)里的Image_to_String方法。Text就是識(shí)別后返回的字符內(nèi)容;Lang是自己訓(xùn)練的字庫(kù)或者Tesseract自帶語(yǔ)言包;Img是預(yù)處理后的圖片。
(4)識(shí)別矯正。對(duì)拒識(shí)或誤識(shí)的圖片字符進(jìn)行矯正。對(duì)于灰度圖可以進(jìn)行灰度調(diào)整,也就是對(duì)比度增強(qiáng)。以灰度圖為例,試驗(yàn)發(fā)現(xiàn)增強(qiáng)前拒識(shí),增強(qiáng)后則識(shí)別正確。
分形幾何學(xué)對(duì)自然界出現(xiàn)的一些不規(guī)則幾何體給出了數(shù)學(xué)描述,其本質(zhì)是“自相似”。用分形理論進(jìn)行圖像分析的原理是利用圖像的分形維數(shù)特征對(duì)目標(biāo)圖像進(jìn)行處理及分析。分形維數(shù)直觀上與物體表面的粗糙度相吻合,圖紙中不同物體的粗糙度有很大差別,因此可用分形維數(shù)作為判別兩張圖紙中對(duì)應(yīng)位置的圖形是否一致的參數(shù)[7]。
高壓電纜附件工藝圖紙尺寸普遍偏大,本文采用盒維數(shù)作為分形維數(shù)的計(jì)算方式,利用分形維進(jìn)行圖紙比對(duì)。
圖紙比對(duì)時(shí),將圖紙分別劃分為P×Q個(gè)區(qū)域,利用分形維數(shù)計(jì)算方法進(jìn)行盒子像素的計(jì)算,根據(jù)兩張圖紙的分形維數(shù)差值絕對(duì)值,根據(jù)參考閾值來進(jìn)行判斷,若小于閾值則判定為不一致,反之則為一致,從而實(shí)現(xiàn)最終的比對(duì)審核和判定[8]。
通過引入圖像識(shí)別技術(shù)、OCR和一致性檢測(cè)算法技術(shù),將高壓電纜附件數(shù)字化工藝庫(kù)中的圖紙、工藝說明書、技術(shù)協(xié)議與數(shù)據(jù)庫(kù)中的原始模板進(jìn)行特征值抽取比對(duì),從而快速識(shí)別兩者之間的差異性,比對(duì)準(zhǔn)確率得到了大大的提升,避免了漏查、誤判,及對(duì)高壓電纜附件工藝后續(xù)造成的影響。
(1)本文建立了一個(gè)基于B/S架構(gòu)數(shù)字化高壓電纜附件工藝庫(kù),錄入所有現(xiàn)有高壓電纜附件的技術(shù)協(xié)議以及工藝圖紙,MySQL關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)的存儲(chǔ)量大大增加,并且更便于檢索,能夠極大程度地保證數(shù)據(jù)的一致性與完整性,滿足工作人員用戶需求,安全可靠且可共享。
(2)圖形識(shí)別利用LBP及HOG特征提取算法提取圖紙中的圖形特征從而獲取局部相似性,并結(jié)合分形維數(shù)的對(duì)比算法與工藝庫(kù)中的標(biāo)準(zhǔn)化圖紙進(jìn)行鑒別比對(duì),最終形成比對(duì)報(bào)告,協(xié)助管理人員實(shí)現(xiàn)高效審核。