徐穎敏 姚林朋 錢勇 黃成軍 江秀臣
(上海交通大學 電氣工程系,上海 200240)
交聯(lián)聚乙烯(XLPE)電纜作為輸送電力的主要設備,其絕緣系統(tǒng)的好壞直接決定了整個城網(wǎng)送電系統(tǒng)能否安全運行。在XLPE電纜的某些薄弱部位,強電場作用極易引起局部放電。如果局部放電持續(xù)存在,一定條件下會導致絕緣劣化甚至擊穿。局部放電是電纜設備監(jiān)測的重要參量,從局放信號中提取的特征參數(shù)能有效地反映XLPE電纜絕緣狀態(tài)。因此,對局部放電信號進行模式識別以及時發(fā)現(xiàn)電纜運行中存在的缺陷故障,對于XLPE電纜的可靠運行具有重要意義[1,2]。
在目前局放模式識別中,神經(jīng)網(wǎng)絡[3],決策樹[4]等算法得到廣泛應用。但是傳統(tǒng)的分類方法僅使用特定的某種分類器進行分類,當先驗知識不足時,很難選擇最優(yōu)的分類器。針對這一問題,本文采用多分類器融合的方法進行局放模式識別,有效地提高了整個系統(tǒng)的分類精度。
人工神經(jīng)網(wǎng)絡作為人工智能技術的一個分支,具備非線性系統(tǒng)的自學習能力,在難以建模的復雜識別等方面具有不可替代的優(yōu)勢。Rtunelhart等人提出了多層感知器神經(jīng)網(wǎng)絡[5]的拓撲結構,為神經(jīng)網(wǎng)絡的研究開創(chuàng)了新思路。多層感知器神經(jīng)網(wǎng)絡由輸入層、隱含層和輸出層組成,其中隱含層可含有若干子層。
在本文中,結合特征參數(shù)的數(shù)量及訓練時間,采用多層感知器模型作為基本分類器。在該模型中,輸入層負責輸入信號的變換傳遞,隱含層完成數(shù)據(jù)處理,后由輸出層將輸出信號進行加權后聚合為神經(jīng)網(wǎng)絡的輸出信號。本文采用反向傳播算法作為訓練算法。該算法結構簡單,且操作性強,能模擬任意的非線性輸入輸出關系,是一種較為成熟的學習算法。
多分類器融合算法通過綜合多個分類器得到的分類信息,得出最終的分類結果。這一分類算法避免了單一分類器可能存在的片面性,有效提高了系統(tǒng)的分類精度。Freund等人提出Boosting算法[6],通過改變訓練樣本的樣本分布和權重,將弱學習算法提升為強學習算法。Freund和Schapire提出了基于Boosting算法的AdaBoost算法[7],克服了Boosting算法在訓練前需獲得基本分類器的識別率下限的問題。由于基本分類器的識別率下限在實際應用中很難預測,AdaBoost算法的這一改進大大提高了其適用性。
本文采用的基于AdaBoost的多感知器神經(jīng)網(wǎng)絡融合模式識別算法原理如圖1所示。其基本設計思想如下:將多個分類能力一般的多感知器神經(jīng)網(wǎng)絡分類器作為基本分類器,采用AdaBoost算法針對不同的訓練集訓練同一個基本分類器(弱分類器),逐步修正分類器的分類錯誤率,然后把不同訓練集上得到的分類器集合后得到一個強分類器。該算法通過調整每個樣本的權重來獲取不同的訓練集,初始狀態(tài)時,樣本的權重值相同,基于此分布可訓練出基本分類器h1(x)。此時,對于h1(x)錯分的樣本,則增加對應樣本的權重,反之則降低其權重。同時,根據(jù)h1(x)識別率設定分類器的權重,錯分的越少則該基本分類器的權重越大,即重要程度越高。重復上述過程T次,可得到T個基本分類器
圖1 基于AdaBoost的神經(jīng)網(wǎng)絡融合算法
根據(jù)權重進行累加后可得到強分類器。
該算法的設計流程描述如下
(1)權值初始化。設樣本均勻分布,則權值
Di(i)表示在i次迭代中賦給樣本(xi,yi)的權值。
(2)基本分類器訓練。將多感知器神經(jīng)網(wǎng)絡作為基本分類器,記為hi(hi為第i次迭代時的神經(jīng)網(wǎng)絡分類器)。
(3)確定迭代次數(shù)??筛鶕?jù)算法實際的分類錯誤率選擇合適的迭代次數(shù),記為T。
(4)執(zhí)行fort=1 to T
① 在訓練集(St為第t次迭代時基本分類器的訓練樣本)St上訓練分類器ht,用分類器ht對訓練集S中的所有樣本分類。
② 得到本次迭代的分類器ht,誤差
則分類器權重為
③ 更新樣本權值
其中Zt為一個正規(guī)因子,使得
(5)輸出結果。分類函數(shù)
即對T個神經(jīng)網(wǎng)絡分類器輸出結果進行加權投票。
目前,XLPE電纜局部放電的測試和研究表明以下情況易產(chǎn)生局部放電現(xiàn)象:電纜內部氣隙在長期工作電壓下,由于壓力變化發(fā)生移動和形變,進而極易生成電樹,導致絕緣破壞和擊穿;由于電纜制造工藝和安裝質量等原因,容易在電纜頭中出現(xiàn)懸浮電極,出現(xiàn)電極放電現(xiàn)象;同時,在線路設計、電纜鋪設等情況下發(fā)生的電暈放電會直接導致電纜絕緣性能的下降;此外,電纜的表面放電和滑閃放電等也是造成絕緣事故頻發(fā)的缺陷類型。
為了驗證本文提出的模式識別方法的有效性,針對上述情況,設計出了導致XLPE電纜發(fā)生局放電的4種典型缺陷模型:內部氣隙放電,懸浮電極放電,表面放電以及電暈放電模型。
實驗中以10kV的XLPE電纜為研究對象,在電纜頭中人工制作這幾類絕緣缺陷。圖2為電纜頭的缺陷模型示意圖,具體制作過程如下:剝開電纜的金屬屏蔽層和外半導體層,針刺XLPE絕緣約1/2左右,作為內部氣隙放電模型;用長條銅片作高壓電極和地電極,固定在XLPE絕緣與硅橡膠之間,通過加壓來測試懸浮放電模型;從導線芯引出約15mm長條銅片作為滑閃通道并固定在XLPE絕緣與硅橡膠之間模擬表面放電。電暈放電則在連接電纜終端頭的高壓導體上懸掛針尖,模擬電暈放電模型。
圖2 電纜頭的絕緣缺陷模型
本文采用脈沖電流檢測方法采集局放信號,局放試驗回路及信號采集系統(tǒng)如圖3所示。
圖3 局放試驗系統(tǒng)結構示意圖
依照圖3所示的系統(tǒng)結構搭建試驗平臺,采用脈沖電流檢測方法采集局放信號?;诓煌钠鹗茧妷簻y試四種電纜缺陷,每次連續(xù)測量50個工頻周期,而后將多個工頻周期的放電信號疊加進行歸一化。基于工頻相位φ和放電量q統(tǒng)計q-φ平面上各區(qū)間內的放電次數(shù)n,得到Hn(q-φ)三維圖譜。
從三維圖譜Hn(q-φ)提取出最大放電量相位分布(Hqmax(φ)),平均放電量相位分布(Hqmean(φ)),放電次數(shù)相位分布(Hn(φ))以及放電量次數(shù)分布(Hqn(φ))四種二維圖譜。為了從二維圖譜中計算特征參數(shù),將圖譜根據(jù)相位信息劃分為正負半周,φ代表隨機變量,q和n代表概率密度,根據(jù)概率密度分布函數(shù)計算相關的統(tǒng)計特征。
偏斜度Sk(Skewness)和陡峭度Ku(Kurtosis)表示了圖譜相對于正態(tài)分布的差異度,互相關因數(shù)cc(Cross-correlation factor)和放電量因數(shù)Q[8]則表示了放電正負半周的相似度。在二維圖譜中選取上述4種特征參數(shù),共得到20個特征其中,下標對應于二維圖譜的下標,上標表示放電的正負半周。
為了盡可能全面地反映局放信號的特征信息,本文選取了20組特征參數(shù)作為模式識別的樣本數(shù)據(jù)。而當樣本特征維數(shù)過高時,會加大系統(tǒng)的計算量從而增加系統(tǒng)的識別時間,選取適當?shù)慕稻S方法可降低樣本數(shù)據(jù)的冗余度以提高識別速度。其中,主成分分析(Principle Component Analysis,PCA)[9]是最為常用的一種線性映射方法。
為了盡可能完整地表示數(shù)據(jù)特征,需借助協(xié)方差矩陣來判斷各特征參數(shù)之間的冗余度,協(xié)方差矩陣包含了所有特征變量之間的相關性度量,于是可對各特征參數(shù)的重要性進行排序,去除貢獻率小的特征變量,達到降維的目的。PCA方法即通過尋找一組正交基P,來表示原始數(shù)據(jù)集X,以對協(xié)方差矩陣進行優(yōu)化,降低變量間的相關度,選取方差最大的方向作為判別矢量來實現(xiàn)數(shù)據(jù)的特征提取。具體步驟如下:
(1)設數(shù)據(jù)集為m×n的矩陣。對應n條絕緣缺陷記錄,每條記錄包含m個特征變量,即每條記錄可表示為一個m維的行向量。
(2)在矩陣行向量上減去該向量的平均值得到矩陣X,對XXT求特征值λ和特征向量v。X的主元即XXT的特征向量。
(3)前k個主元的累計貢獻率定義為
設定累計貢獻率的最小值,即可選取前k個主元代替原始數(shù)據(jù)集,達到降維的目的。
絕緣缺陷的記錄共有4種缺陷類型,每種類型各100條樣本,共計400條。其中,每個樣本包含20個特征參數(shù)。同時采取10折交叉驗證法檢驗識別率。
將多層感知神經(jīng)網(wǎng)絡作為基本分類器,隱含層數(shù)目為3層,隱含層節(jié)點數(shù)為4,學習率為0.3,訓練次數(shù)為1000次。
(1)調整AdaBoost算法的迭代次數(shù),識別率隨其變化的曲線如圖4所示??梢钥闯鲭S著算法迭代次數(shù)的增加,即神經(jīng)網(wǎng)絡基本分類器數(shù)目的增加,算法識別率逐漸增加,當?shù)竭_一定值后,識別率的變化趨向于平衡。根據(jù)這一變化曲線,將迭代次數(shù)選為6次,此時,識別率基本處于最高值。
圖4 識別率隨迭代次數(shù)的變化曲線
(2)采用主成分分析法降維,當累計貢獻率為99%,95%和80%時,維數(shù)分別降至6維,3維和2維。應用AdaBoost算法對降維后的缺陷數(shù)據(jù)進行識別,結果如表1所示:
表1 不同維數(shù)樣本的識別性能
由表中數(shù)據(jù)分析,當累積貢獻率在80%(2維)時,識別性能有明顯下降,而當累積貢獻率在95%和99%時,AdaBoost方法的識別率有所降低但仍接近最高值,而此時維數(shù)分別降至3維和6維,與原始缺陷數(shù)據(jù)相比,維數(shù)已經(jīng)大大縮減。同時,當維數(shù)減少時,采用AdaBoost算法進行識別的時間也大大縮短。因此采用PCA方法對樣本集進行預處理的方法能有效降低樣本維數(shù)而不會對識別結果造成較大影響,并可有效地縮短訓練神經(jīng)網(wǎng)絡基本分類器的時間。
從識別率對基于AdaBoost的神經(jīng)網(wǎng)絡融合算法和多層感知器神經(jīng)網(wǎng)絡單一分類器進行對比,采用經(jīng)過主成分分析法的缺陷樣本。僅采用多層感知器模型進行識別,識別率為84.7%,分類時間為1.03s;采用AdaBoost算法進行識別,識別率明顯上升,當?shù)螖?shù)為6次,識別率趨近最高值為94.7%,分類時間為2.56s。由此得出,在識別率方面,AdaBoost算法的識別率明顯高于單一的多層感知器神經(jīng)網(wǎng)絡模型,說明該算法可有效地提高系統(tǒng)的精度;在分類時間方面,AdaBoost算法由于需對多個基本分類器進行訓練,所以分類時間比單一分類器長;但由于基本分類器本身訓練時間較短,所以分類時間的增加對識別過程影響不大。
本文介紹了基于AdaBoost的多感知器神經(jīng)網(wǎng)絡融合分類模型。該方法提取相關的局放特征參數(shù),采用主成分分析法進行降維,將多感知器神經(jīng)網(wǎng)絡作為基本分類器,采用AdaBoost算法進行訓練,應用到XLPE電纜局部放電模式識別中。
理論分析和實驗仿真的結果表明,本文提出的基于多分類器融合的模式識別方法的識別率明顯優(yōu)于單一分類器,采用主成分分析法降維后大大提高了分類效率,提供了一種用于局部放電模式識別新的可行性方案。
[1] 郭燦新,張麗,錢勇,等.XLPE電力電纜中局部放電檢測及定位技術的研究現(xiàn)狀[J].高壓電器,2009(03):56-60.
[2] 陳小林,成永紅,謝小軍,等.XLPE絕緣電老化中局放特性試驗研究[J].高電壓技術,2006,32(4).
[3] 楊孝華,廖瑞金,胡建林,等.基于BP人工神經(jīng)網(wǎng)絡的XLPE電力電纜局部放電的模式識別[J].高壓電器,2003,(04).
[4] Abdel-Galil,T K,SHARKAWY R M,SALAMA M M A,et al.Partial discharge pulse pattern recognition using an inductive inference algorithm[J].IEEE Transactions on Dielectrics and Electrical Insulation,2005,12(2):320-327.
[5] Mazroua A A,M M A Salama,et al.PD pattern recognition with neural networks using the multilayer perceptron technique[J]. IEEE Transactions on Electrical Insulation,1993,28(6):1082-1089.
[6] Freund Y.Boosting a weak algorithm by majority [J].Machine Learning,1990,5(2):197-227.
[7] Freund Y.Schapire R.E.A Decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.
[8] SAHOO NC,SALAMA M M A,BARTNIKAS R.Trends in partial discharge pattern classification:A survey[J].IEEE Transactions on Dielectrics and Electrical Insulation,2005,12(2):248-264.
[9] 楊淑瑩.模式識別與智能計算:Matlab技術實現(xiàn)[M].北京:電子工業(yè)出版社,2008.