鄒 凱, 曾憲文, 王 洋, 高桂革
(1. 上海電機學院 電氣學院, 上海 201306; 2. 上海電機學院 電子信息學院, 上海 201306)
隨著“雙碳”理念的提出,新能源被加速開發(fā)和利用,其中風光裝機容量占比預計到2060年將提升到60%,發(fā)電量將超過55%[1]。然而,光伏陣列是光伏發(fā)電的核心部件,其長期暴露在外,易發(fā)生一些故障,如斷路、短路、遮陰、老化等[2-3]。因此,對光伏陣列進行高效準確的故障診斷研究,具有重要意義[4-5]。
現(xiàn)階段對光伏陣列故障診斷的研究方法主要基于數(shù)值型數(shù)據(jù)結(jié)合機器學習模型,如支持向量機(Support Vector Machines, SVM)、反向傳播(Back Propagation, BP)神經(jīng)網(wǎng)絡、RBF 神經(jīng)網(wǎng)絡、隨機森林(Random Forest, RF)等[6-9],但這些算法直接用于故障診斷存在準確率不高的問題。隨著大量群搜索算法的提出,學者們已經(jīng)利用搜索算法優(yōu)化機器學習。文獻[10]利用遺傳算法來優(yōu)化BP神經(jīng)網(wǎng)絡,診斷精度得到了提升;文獻[11]利用麻雀搜索算法對深度信念網(wǎng)絡調(diào)參,增強了模型的泛化能力;文獻[12]利用禿鷹算法優(yōu)化SVM 對變壓器進行故障診斷,并與布谷鳥、人工蜂群和螢火蟲算法優(yōu)化SVM 的模型對比,表明禿鷹算法優(yōu)化后的效果最好。然而以上這些算法仍存在一些問題,算法本身可能會陷入局部最優(yōu),導致模型的最優(yōu)參數(shù)難以獲取,因此使用群搜索算法來優(yōu)化參數(shù),并對搜索算法進行改進。
為進一步提高光伏陣列故障診斷的準確率,本文由此展開了研究。首先利用Simulink平臺建立4×3的光伏陣列模型,對正常和典型故障狀態(tài)進行仿真分析,提取故障特征數(shù)據(jù),其次利用線性判別分析(Linear Discriminant Analysis, LDA)對原始數(shù)據(jù)降維,并把降維后的數(shù)據(jù)作為故障診斷模型的輸入;最后利用3個策略改進禿鷹算法來優(yōu)化RELM 隱層參數(shù),并與其他模型對比,驗證本文模型故障診斷的準確性和有效性。
利用Matlab/Simulink建立4×3的光伏陣列仿真模型,通過對正常、開路、短路、局部陰影、輕度老化、大面積陰影、重度老化7種狀態(tài)進行仿真實驗,并獲取大量故障數(shù)據(jù)。
將任1組串斷開模擬開路,將某1光伏板正負極短接模擬短路。局部陰影將某1塊板的光照強度設置在50~150W/m2,大面積陰影設置3塊板的光強在50~150W/m2,輕度老化則是在某1組串聯(lián)2Ω 電阻,重度老化串聯(lián)8Ω 電阻,故障模擬圖如圖1所示。在光照強度為1kW/m2,溫度為25℃的條件下生成各種狀態(tài)下的P-U曲線和I-U曲線對比情況,如圖2、圖3所示。從圖2、圖3可以看出開路時的短路電流和最大功率點電流相對較小;對于短路故障,其開路電壓較其他狀態(tài)差別明顯;陰影故障出現(xiàn)了多峰;老化故障的最大功率點電壓和電流變化較明顯,且從輕度到重度老化程度的變化,最大功率點電壓和電流均在減小。因此可以選擇開路電壓(Uoc)、短路電流(isc)、最大功率點電壓(Um)、最大功率點電流(im)和最大功率(Pm)作為部分特征量。
圖3 各種狀態(tài)下的I-U 曲線對比
在光強為400~1005 W/m2,溫度在15~45℃的范圍內(nèi)進行仿真,總共獲取1750組數(shù)據(jù),其中訓練集1400組(每種狀態(tài)各200組),測試集350組(每種狀態(tài)各50組)。再計算每組數(shù)據(jù)的填充因子FF,即
將以上5個參數(shù)和填充因子作為光伏故障數(shù)據(jù)的特征量。并規(guī)定正常、開路、短路、局部陰影、輕度老化、大面積陰影、重度老化的標簽值分別為1、2、3、4、5、6、7。
利用LDA 對特征量降維作為故障診斷模型的輸入。LDA降維就是將原數(shù)據(jù)投影到低維的空間內(nèi),并且使同類數(shù)據(jù)盡可能聚集,異類數(shù)據(jù)盡可能遠離[13-14]。利用LDA 對1.1中采集的數(shù)據(jù)降維,把降維后的數(shù)據(jù)作為最終的故障診斷特征量,至此故障特征提取工作完成,最終將此數(shù)據(jù)用于第三部分故障診斷模型的訓練和測試。
BES是由Alsattar等提出的一種啟發(fā)式算法[15]。該算法模擬了禿鷹的捕食行為,分為3個階段:選擇空間,空間搜索和俯沖階段。第1階段為禿鷹選擇空間,位置更新為
式中:Pnew,i為第i只禿鷹更新后的新位置;Pbest為最優(yōu)位置;α為控制禿鷹位置變化的參數(shù);r為隨機數(shù);Pmean為根據(jù)前一個階段結(jié)束后得到的禿鷹平均位置;Pi為第i只禿鷹的當前位置。
α的范圍在[1.5,2]之間,r的范圍在[0,1]之間。
第2階段是空間搜索,即在上一階段搜索到的最佳空間內(nèi)搜索獵物,位置更新為
式中:x(i)、y(i)為極坐標位置。
x(i)=xr(i)/max[|xr(i)|],y(i)=yr(i)/max[|yr(i)|],其范圍均為[-1,1]。其中xr與yr是決定極坐標的變量,且xr(i)=r(i)sin[θ(i)],yr(i)=r(i)cos[θ(i)],θ(i)是極角,r(i)是極徑,且θ(i)=απrand,r(i)=θ(i)+Rrand,α和R均是該螺旋方程控制位置的參數(shù),范圍分別在[5,10]和[0.5,2]。
第3階段的位置更新為
式中:c1、c2為禿鷹向最優(yōu)位置和中心位置的移動強度;x1、y1為極坐標位置。
c1和c2的范圍均為[1,2],x1(i)=x(i),y1(i)=y(i),此時xr(i)=r(i)sinh[θ(i)],yr(i)=r(i)cosh[θ(i)],θ(i)=απrand,r(i)=θ(i)。
由于種群個體收斂較快容易陷入局部最優(yōu),以及在后期因搜索空間較小也會陷入局部最優(yōu)。因此針對以上問題本文對禿鷹搜索算法進行改進。
2.2.1 Logistic混沌映射 采用Logistic混沌映射對禿鷹算法初始化種群,取代傳統(tǒng)的隨機初始化種群方法,增加了隨機性和多樣性,使得該算法更容易搜索到全局最優(yōu)解。即
式中:xn+1為混沌映射后的個體;xn為[0,1]之間的任意數(shù);μ為分支參數(shù),本文中取4。
改進后的初始種群為
式中:ub、lb分別為禿鷹搜索算法的上限和下限。
2.2.2 Levy飛行策略 在選擇空間階段引入Levy飛行策略,Levy飛行是一種隨機游走的尋優(yōu)策略,該方法憑借小步跟蹤和長距離跳躍的特點幫助算法跳出局部最優(yōu)。在搜索初期階段使得禿鷹群體有著更廣泛的搜索范圍,在利用Logistic混沌映射初始化種群的基礎上使得算法更具備全局尋優(yōu)能力。更新后的禿鷹選擇空間階段的公式為
式中:δ為步長控制參數(shù)。而
2.2.3 柯西高斯變異擾動策略 在算法后期引入了柯西高斯變異擾動策略[16],加入該策略可以很好地提升后期全局搜索的能力,因此本文選用該方法對禿鷹算法進行改進。在每次迭代結(jié)束后,執(zhí)行該變異操作,若更新后的位置優(yōu)于當前最優(yōu)位置,則替換當前全局最優(yōu)解,變異擾動后的新位置為
式中:C(0,1)、G(0,1)分別為滿足柯西和高斯分布的隨機變量;λ1、λ2分別為1-t2/T2、t2/T2;t為每次的迭代次數(shù);T為最大迭代次數(shù)。
本文為驗證IBES改進后的全局搜索能力,選取了文獻[17]中F3、F4、F6函數(shù)測試,并規(guī)定搜索范圍分別為[-10,10]、[-100,100]、[-100,100]。設置維度D=30,種群數(shù)N=30,最大迭代次數(shù)T=100,分別對粒子群算法(PSO)、灰狼算法(GWO)、BES和IBES算法進行測試,3個測試函數(shù)的收斂曲線如圖4~圖6所示。
圖4 函數(shù)F3測試結(jié)果對比
圖5 函數(shù)F4測試結(jié)果對比
圖6 函數(shù)F6測試結(jié)果對比
圖4 ~圖6均反映出在100次迭代內(nèi),IBES算法的尋優(yōu)性能優(yōu)于對比的3個算法。其中,PSO和GWO 算法均陷入了局部最優(yōu),只有IBES在3個測試函數(shù)下能跳出局部最優(yōu)并搜索到全局最優(yōu)解。從而驗證了IBES算法的尋優(yōu)性能較好,可有效用于對RELM 的參數(shù)尋優(yōu)。
極限學習機(Extreme Learning Machine, ELM)是單隱藏層的反饋神經(jīng)網(wǎng)絡,輸入數(shù)據(jù)通過隱含層的映射,最終可以得到輸出。設樣本數(shù)據(jù)集(Xi,ti),其中Xi=[xi1,xi2,…,xin]T表示神經(jīng)網(wǎng)絡的輸入,ti=[ti1,ti2,…,tin]T表示輸出,則具有L個隱層節(jié)點的ELM 網(wǎng)絡為
式中:wi為輸入與隱含層之間的權(quán)值;bj為隱層偏置;βi為輸出權(quán)重;wi·xj為wi與xj的內(nèi)積;oj為網(wǎng)絡輸出;g(x)為激活函數(shù)。wi=[wj1,wj2,…,wjn]T,bj=[bj1,bj2,…,bjn]T。
為了保證輸出誤差最小,可以用下式表示,即
式中:H為隱含層的輸出;T為預期輸出。
求解β的過程就是利用最小二乘法,即β=HTT。投影后,可以得到H+=(HTH)-1HT,其中H+是H的廣義逆矩陣。在計算β時,引入?yún)?shù)1/λ可以使該算法獲得更好的泛化性能,并解決了在求解H+的過程中數(shù)值不穩(wěn)定的問題[18]。利用正則化最小二乘法來求解β就是RELM 的求解過程,即
式中:λ為正則化參數(shù)。
利用1.2中降維后的數(shù)據(jù)輸入到RELM 模型中,經(jīng)過測試其準確率為90.29%,準確率有待提升,由于RELM 的輸入層權(quán)值和隱層偏置這兩個參數(shù)組合(W,B)是隨機產(chǎn)生的,其取值對模型準確率影響較大,因此本文將2.2中的IBES算法來優(yōu)化RELM 的隱層參數(shù),搭建LDA-IBES-RELM模型。
設置模型中的適應度函數(shù)為
其中:trF、trall、teF、teall分別表示模型訓練錯誤數(shù)、訓練集總數(shù)、測試錯誤數(shù)、測試集總數(shù)。
該模型的實現(xiàn)步驟如下:
步驟1數(shù)據(jù)預處理。利用LDA 對原始數(shù)據(jù)降維,確定新的訓練集和測試集及對應的標簽值。
步驟2初始化RELM 的相關參數(shù),確定IBES的相關參數(shù),包括種群數(shù),最大迭代次數(shù),維度,搜索區(qū)域。利用IBES算法的混沌映射初始化種群位置(W,B),隨后進行訓練測試并計算適應度。
步驟3根據(jù)IBES算法更新位置,并確定每次迭代后的最優(yōu)解。
步驟4判斷是否已達到最大迭代次數(shù),若是則停止搜索并輸出最優(yōu)參數(shù)組合(W,B),從而確定最佳的故障診斷模型。否則繼續(xù)執(zhí)行算法,直到滿足終止條件。
本文分別對BES-RELM、IBES-RELM、LDAIBES-RELM 3 種模型做了測試對比實驗,驗證IBES對RELM 算法隱層參數(shù)的尋優(yōu)能力以及LDA降維后的模型準確率。迭代次數(shù)設為80,種群數(shù)為30。圖7反映了3種模型的適應度變化情況的對比,圖8~圖10分別是以上3種模型的測試結(jié)果。
圖7 3種模型的適應度變化對比
由圖7可知,改進后的IBES算法的尋優(yōu)性能優(yōu)于BES算法,且IBES算法能很快收斂到全局最優(yōu)解。而與LDA降維技術(shù)結(jié)合,優(yōu)化后的模型適應度最優(yōu)解更佳,從0.13左右降到0.038左右,即故障診斷模型的準確率也得到提升。
根據(jù)圖8分析,BES-RELM 模型的測試結(jié)果中,出現(xiàn)了6個正常數(shù)據(jù)診斷為故障,總體準確率為91.71%;根據(jù)圖9分析,IBES-RELM 模型不存在正常數(shù)據(jù)診斷錯誤的情況,但依然存在大量輕度老化故障數(shù)據(jù)診斷錯誤的情況,總體準確率為92.86%。根據(jù)圖10分析,LDA-IBES-RELM 模型就解決了輕度老化故障類別診斷準確率低的問題,該類別只有3個數(shù)據(jù)診斷錯誤,且開路故障的誤診數(shù)減少到4個,總體準確率達到了97.71%,比以上2種模型準確率分別提高了6%和4.85%,比傳統(tǒng)RELM 準確率提高了7.42%。
圖9 IBES-RELM 模型測試結(jié)果
圖10 LDA-IBES-RELM 模型測試結(jié)果
本文還利用降維后的數(shù)據(jù)分別對PSO-RELM、GWO-RELM、BES-RELM 模型進行了測試。測試結(jié)果如表1所示。
由表1可知,禿鷹算法優(yōu)化的模型故障診斷準確率優(yōu)于PSO及GWO算法,且改進后的IBES算法效果更佳,同時也驗證了IBES具有較強的搜索性能。
本文利用Simulink建立光伏陣列模型并仿真出故障數(shù)據(jù),提出LDA-IBES-RELM 故障診斷模型,并對該模型做了訓練和測試,得出以下結(jié)論:
(1) IBES 的尋優(yōu)性能優(yōu)于BES 及PSO 和GWO 算法,且柯西高斯變異對算法的改進效果較好。
(2) 本文提出的LDA 降維方法能夠保留原始數(shù)據(jù)影響力較大的特征,并能過濾掉一些冗余特征,結(jié)合機器學習算法更能提高模型的預測準確率。
(3) LDA-IBES-RELM 模型用于光伏陣列故障診斷,訓練速度快,準確率高。該模型也可以用于其他領域的故障診斷和分類問題。