楊曉燕,謝滿承,郭小璇,趙巖,陳翀旻,陳子民,廖卓穎
(1.廣西電網(wǎng)有限責(zé)任公司南寧供電局,南寧 530001; 2.廣西電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,南寧 530023;3.中國(guó)科學(xué)院廣州能源研究所,廣州 501640)
隨著我國(guó)“雙碳”目標(biāo)的提出及碳減排工作的不斷深入,以新能源為主體的新型電力系統(tǒng)快速發(fā)展,光伏發(fā)電因可用性高、安裝速度快、維護(hù)成本低、能源獨(dú)立性強(qiáng),成為常用的可再生清潔能源之一[1-2]。國(guó)家能源局公布的數(shù)據(jù)顯示,截至2022 年年底,全國(guó)累計(jì)光伏并網(wǎng)容量約為3.920 4 億kW,同比增長(zhǎng)了28.12%,其中集中式光伏電站累計(jì)并網(wǎng)容量為2.344 2 億kW,分布式光伏電站累計(jì)并網(wǎng)容量為1.576 2 億kW[3]。光伏電站系統(tǒng)由組件、逆變器、匯流箱、支架等多個(gè)部件組成,它們通常在惡劣的室外環(huán)境中運(yùn)行,強(qiáng)風(fēng)、大雨、冰雹、污染、紫外線、熱循環(huán)和不當(dāng)?shù)倪\(yùn)輸、安裝、維護(hù)等都會(huì)導(dǎo)致光伏系統(tǒng)出現(xiàn)各種故障[4]。光伏系統(tǒng)部件眾多,任何一個(gè)環(huán)節(jié)出現(xiàn)問題,都會(huì)影響電站的正常運(yùn)行[5],輕則損失發(fā)電量(據(jù)Firth 等的統(tǒng)計(jì),光伏陣列故障可導(dǎo)致輸出電能減少18.9%[6]),重則引起火災(zāi)等。光伏系統(tǒng)故障大多發(fā)生在直流側(cè),即模塊或陣列本身,也可能發(fā)生在交流側(cè),涉及逆變器或與電網(wǎng)的連接異常[7]。據(jù)統(tǒng)計(jì),組件、逆變器、匯流箱等直流側(cè)設(shè)備故障占比高達(dá)90.18%;電纜、箱式變電站、土建、升壓站等交流側(cè)設(shè)備故障占比達(dá)9.82%[8]。為了確保光伏陣列可靠運(yùn)行,近年來許多國(guó)內(nèi)外學(xué)者對(duì)故障檢測(cè)和診斷方法進(jìn)行了廣泛研究。
通過時(shí)序電流-電壓(I-V)測(cè)量進(jìn)行光伏陣列故障診斷是目前較普遍的診斷方法[9],光伏電站數(shù)據(jù)采集與監(jiān)視控制(SCADA)系統(tǒng)通過傳感器測(cè)量并采集各部件的相關(guān)運(yùn)行參數(shù),這些電壓、電流、頻率等參數(shù)能反映組件的運(yùn)行狀態(tài)信息[10]。對(duì)比電壓、電流、頻率等數(shù)據(jù)正常運(yùn)行值和實(shí)際值間的差值,經(jīng)過算法分析得到故障診斷的結(jié)果[9]。在分析計(jì)算過程中,常采用群智能算法對(duì)核極限學(xué)習(xí)機(jī)[11-12]、神 經(jīng) 網(wǎng) 絡(luò)[13]、隨 機(jī) 森 林(Random Forest,RF)[14]等分類診斷算法進(jìn)行優(yōu)化。文獻(xiàn)[11]提出了一種基于螢火蟲擾動(dòng)的改進(jìn)麻雀搜索算法優(yōu)化傳統(tǒng)極限學(xué)習(xí)機(jī)的光伏系統(tǒng)故障診斷方法,能夠有效解決傳統(tǒng)故障診斷方法收斂速度慢的問題。文獻(xiàn)[12]利用Levy 飛行策略和自適應(yīng)t分布策略對(duì)麻雀搜索算法進(jìn)行改進(jìn),再利用改進(jìn)后的麻雀搜索算法對(duì)核極限學(xué)習(xí)機(jī)的核參數(shù)和正則化系數(shù)進(jìn)行優(yōu)化,提高了核極限學(xué)習(xí)機(jī)分類的準(zhǔn)確率。文獻(xiàn)[13]提出了利用自適應(yīng)權(quán)重粒子群對(duì)反向傳播(Back Propagationg,BP)神經(jīng)網(wǎng)絡(luò)優(yōu)化的光伏陣列故障診斷方法,提高了故障診斷的實(shí)時(shí)性。文獻(xiàn)[14]提出了一種基于級(jí)聯(lián)RF 的光伏組件在線故障診斷模型,其準(zhǔn)確率和收斂時(shí)間都優(yōu)于單一的RF 模型與BP神經(jīng)網(wǎng)絡(luò)模型。
神經(jīng)網(wǎng)絡(luò)故障診斷方法對(duì)樣本數(shù)量要求高,對(duì)相關(guān)參數(shù)的依賴性強(qiáng);核極限學(xué)習(xí)機(jī)方法對(duì)數(shù)據(jù)集中存在的離群點(diǎn)過于敏感;而RF 算法對(duì)泛化誤差采用無偏估計(jì),具有較強(qiáng)的泛化能力及強(qiáng)抗干擾和抗過擬合特性。因此,本文選擇RF 分類器作為光伏系統(tǒng)故障診斷的基礎(chǔ)算法,同時(shí)在原子軌道搜索(Atomic Orbital Search,AOS)算法的基礎(chǔ)上提出改進(jìn)的IAOS 算法,共同構(gòu)建光伏陣列故障診斷模型。首先,對(duì)光伏系統(tǒng)故障進(jìn)行分類;然后,用IAOS算法優(yōu)化RF 分類器,形成更加高效的IAOS-RF 模型;最后,對(duì)光伏系統(tǒng)故障進(jìn)行仿真試驗(yàn)分析。
本文使用實(shí)驗(yàn)室可實(shí)現(xiàn)的典型并網(wǎng)光伏系統(tǒng)來驗(yàn)證所提算法在最大功率點(diǎn)跟蹤(Maximum Power Point Tracking,MPPT)模式下的故障診斷性能。該光伏系統(tǒng)由N×M個(gè)光伏組件陣列、反饋傳感器、MPPT 控制器、逆變器和升壓變壓器組成,系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 光伏系統(tǒng)結(jié)構(gòu)Fig.1 Structure of a PV system
常見的光伏系統(tǒng)故障只考慮了光伏組件老化、遮陰問題和陣列之間的短路、開路問題[15-17],很少涉及系統(tǒng)中傳感器、控制器、逆變器等元件的故障。本文除了常見的光伏陣列故障,更偏重對(duì)不同元件的故障類型進(jìn)行分類,所述光伏系統(tǒng)不同工作狀態(tài)包括正常狀態(tài)、逆變器故障、反饋傳感器故障、電網(wǎng)異常故障、局部陰影故障、單支路開路故障、MPPT控制器故障和升壓轉(zhuǎn)換器控制器故障,并對(duì)此進(jìn)行編號(hào)。表1為以上運(yùn)行狀態(tài)及故障成因。
AOS 算法是在原子搜索算法基礎(chǔ)上提出的新型元啟發(fā)式算法,原子間的相互作用力是該算法數(shù)學(xué)模型的關(guān)鍵,而電子密度配置和原子吸收或發(fā)射能量的基本原理則是AOS算法的主要思想[18]。AOS算法模擬了電子在高低兩種能態(tài)之間的轉(zhuǎn)移過程,在該算法中,每個(gè)電子代表一個(gè)可行解X,搜索空間為圍繞原子核的電子云,其物理模型可分成不同半徑的薄球殼層,也稱為電子軌道。每個(gè)電子由搜索空間中的可行解Xi表示,決策變量xji用于定義候選解在搜索空間中的位置,該目標(biāo)的數(shù)學(xué)方程為
式中:m為搜索空間內(nèi)電子的數(shù)量;d為可行解的維數(shù)。
電子云中電子的初始位置根據(jù)以下數(shù)學(xué)方程隨機(jī)確定。
式中:E為目標(biāo)函數(shù)值的向量;Ei為第i個(gè)電子的能級(jí)。
在基于量子的原子模型中,電子在原子核周圍的位置由電子的概率密度函數(shù)(Probability Density Function,PDF)決定。原子核周圍的電子云分為多個(gè)虛擬層,PDF用于確定可行解在這些層中的位置??尚薪饣谧钚』蜃畲蠡瘍?yōu)化問題按升序或降序進(jìn)行排序,較好目標(biāo)函數(shù)值的可行解代表較低能級(jí)的電子。因此,具有較高PDF 值的可行解位于內(nèi)部虛擬電子層,而具有較低PDF 值的可行解位于外部虛擬電子層,如圖2所示。
圖2 通過PDF確定可行解位置Fig.2 Determining the positions of solution candidates by PDF
圖2 所示的原子軌道模型中,隨機(jī)整數(shù)n用于表示虛擬層L的數(shù)量。這些層將整個(gè)搜索空間劃分為多個(gè)部分,以便在數(shù)學(xué)上表示原子核周圍電子的波動(dòng)行為。這些層的半徑表示這些層在核周圍的分布方式,其中較小半徑的層為核層(L0),較大半徑的層為核周圍n個(gè)(L1—Ln)球形層。
虛擬層中可行解位置Xk和目標(biāo)函數(shù)值Ek的矢量方程如下
在光子的發(fā)射、吸收部分的更新策略中引入自適應(yīng)權(quán)重和反向?qū)W習(xí)機(jī)制更新電子位置,可以提高搜索空間的全面勘探和開發(fā)能力,更加快速準(zhǔn)確地找到最佳值。
利用IAOS算法對(duì)RF的決策樹數(shù)目和決策樹深度進(jìn)行優(yōu)化求解,形成更加高效的組合訓(xùn)練模型。選取該模型的期望輸出值和實(shí)際輸出值的均方差為目標(biāo)函數(shù)即適應(yīng)度值,利用原子軌道中的電子聚集來確定決策樹數(shù)目和決策樹深度,當(dāng)均方差值最小時(shí),就確定了RF的一組理論最優(yōu)參數(shù)。IAOS-RF模型的具體實(shí)現(xiàn)步驟如下。
(1)數(shù)據(jù)預(yù)處理。對(duì)采集的原始特征參數(shù)進(jìn)行數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)歸一化和數(shù)據(jù)打亂等。
(2)算法初始化。初始化AOS 算法參數(shù)和RF的最大迭代次數(shù),其中AOS 算法參數(shù)及其常見的取值范圍為:軌道數(shù)n∈[2,10],原子數(shù)i∈[2,50],光子速率vp∈(0,1)。
(3)計(jì)算個(gè)體適應(yīng)度值。每個(gè)電子都有一個(gè)能量狀態(tài),對(duì)應(yīng)各個(gè)個(gè)體的適應(yīng)度值。
(4)確定各個(gè)層級(jí)的結(jié)合能和結(jié)合態(tài)。將各層中的電子位置平均值記為結(jié)合態(tài),結(jié)合能為各個(gè)個(gè)體適應(yīng)度值的平均值。
(5)更新電子位置。引入自適應(yīng)權(quán)重和反向?qū)W習(xí)機(jī)制對(duì)光子的發(fā)射、吸收部分的更新策略進(jìn)行改進(jìn),更新電子狀態(tài)。
(6)更新電子最優(yōu)位置與適應(yīng)度值。在尋優(yōu)迭代過程中,對(duì)電子的位置向量和適應(yīng)度進(jìn)行更新。
(7)確定RF 分類器最優(yōu)參數(shù)。重復(fù)步驟(3)—(6),當(dāng)達(dá)到算法最大迭代次數(shù)或滿足算法設(shè)定精度時(shí),則認(rèn)為算法趨于收斂,停止迭代,輸出理論最優(yōu)決策樹數(shù)目和決策樹深度給RF分類器。
(8)抽取子數(shù)據(jù)集。采取有放回的抽樣方式在原始數(shù)據(jù)集中進(jìn)行子數(shù)據(jù)集的隨機(jī)抽取。
(9)構(gòu)建決策樹。假設(shè)一個(gè)子數(shù)據(jù)集有X個(gè)屬性,決策樹的節(jié)點(diǎn)需要分裂時(shí),從這些屬性中隨機(jī)抽選出Y個(gè)屬性(Y?X);再通過信息增益方式從Y個(gè)屬性中選擇一個(gè)作為該節(jié)點(diǎn)的分裂屬性;不斷重復(fù)這個(gè)步驟,直到達(dá)到?jīng)Q策深度值為止。
(10)構(gòu)建RF。按照步驟(8)—(9)來構(gòu)建大量若干的決策樹直到達(dá)到?jīng)Q策樹數(shù)目值為止,這些子決策樹就會(huì)構(gòu)成RF。
(11)進(jìn)行故障診斷。將數(shù)據(jù)集輸入不同的子決策樹,得到不同的判斷結(jié)果,判斷結(jié)果最多的就是RF的最佳故障診斷分類結(jié)果。
本文數(shù)據(jù)來自Azzeddine Bakdi提供的實(shí)驗(yàn)室并網(wǎng)光伏系統(tǒng)故障數(shù)據(jù)[19]。在并網(wǎng)光伏系統(tǒng)的8種工作狀態(tài)下分別采集200 組數(shù)據(jù),共1 600 組,隨機(jī)抽取1 200 組數(shù)據(jù)作為故障診斷的訓(xùn)練樣本,其余400組數(shù)據(jù)作為該模型的測(cè)試樣本。采用的光伏發(fā)電陣列工作于最大功率點(diǎn),關(guān)注的電氣參數(shù)包括光伏陣列電流Ipv、光伏陣列電壓Vpv、直流電壓Vdc、A 相電流ia、B相電流ib、C相電流ic、A相電壓va、B相電壓vb、C相電壓vc,典型樣本數(shù)據(jù)見表2。
將IAOS-RF 算法的最大迭代次數(shù)設(shè)為100,用于電子位置測(cè)定的光子率設(shè)為0.1,電子數(shù)量設(shè)為30,虛擬層數(shù)設(shè)為5。以上參數(shù)對(duì)算法性能的影響是相互關(guān)聯(lián)的:較小的最大迭代次數(shù)和較高的光子率可加快算法的收斂速度,但也可能降低搜索的精度;較多的電子數(shù)量和較大的虛擬層數(shù)可以增加全局搜索的能力,但也增加了計(jì)算和存儲(chǔ)的壓力。因此,選擇適當(dāng)?shù)膮?shù)組合以平衡算法的速度和品質(zhì)至關(guān)重要。本文參數(shù)設(shè)定原因如下。
表2 光伏陣列典型樣本數(shù)據(jù)Table 2 Typical sample data for PV arrays
(1)本算法用于故障診斷場(chǎng)景時(shí),目標(biāo)函數(shù)趨于穩(wěn)定所需的迭代次數(shù)基本都少于100,因此將最大迭代次數(shù)設(shè)為100。較小的迭代次數(shù)可以在相對(duì)較短的時(shí)間內(nèi)得到結(jié)果,適用于簡(jiǎn)單問題或需要較快得到結(jié)果的場(chǎng)景,避免算法過度迭代。
(2)較高的光子率意味著光子更有可能進(jìn)入較遠(yuǎn)的位置,擴(kuò)大搜索空間,以便更好地發(fā)現(xiàn)潛在的解,但會(huì)降低搜索精度。綜合考慮精度和收斂速度要求,選擇光子率為0.1。
(3)較多的電子數(shù)量可以提高算法的全局搜索能力,但也增加了計(jì)算和存儲(chǔ)的成本,選擇適當(dāng)?shù)碾娮訑?shù)量可在考慮效率的同時(shí)保持算法的搜索品質(zhì)。為了平衡搜索的速度和精度,將電子數(shù)量設(shè)為30。
(4)通過引入虛擬層,算法可以探索更多不同的解并避免陷入局部最優(yōu)解,較大的虛擬層數(shù)將增加計(jì)算和存儲(chǔ)要求,但可以提高算法的搜索效果。為了增加搜索的靈活性和多樣性,將虛擬層數(shù)設(shè)為5。
利用3.1 節(jié)采集的數(shù)據(jù)集,在IAOS-RF 算法模型中進(jìn)行迭代訓(xùn)練,將訓(xùn)練結(jié)果與AOS-RF 模型和傳統(tǒng)RF 模型的訓(xùn)練結(jié)果進(jìn)行對(duì)比,其中各電氣特征參數(shù)在診斷過程中的重要性如圖3 所示。其中,Ipv,Vpv,Vdc這3 個(gè)特征參數(shù)占較高比重。由此可見,不同運(yùn)行狀態(tài)下,這3個(gè)參數(shù)差異較大,其閾值差能有效幫助識(shí)別故障類型。
圖3 電氣特征參數(shù)的重要性Fig.3 Importance of electrical characteristic parameters
經(jīng)過仿真試驗(yàn)得到IAOS-RF 和AOS-RF 算法模型的迭代次數(shù)值和適應(yīng)度值,結(jié)果見表3。由表3可以看出:IAOS-RF 算法模型迭代55次左右時(shí)目標(biāo)函數(shù)的結(jié)果就趨于穩(wěn)定,而AOS-RF 需要迭代70 次左右才能趨于穩(wěn)定,說明改進(jìn)后的算法可以更好地跳出局部極值點(diǎn),能以更快的速度收斂到全局最優(yōu);同時(shí),IAOS-RF 算法模型適應(yīng)度為0.032,而AOS-RF算法模型的適應(yīng)度為0.035,說明改進(jìn)后的算法尋優(yōu)精度更好。這是因?yàn)橐肓俗赃m應(yīng)權(quán)重和反向?qū)W習(xí)機(jī)制對(duì)光子發(fā)射和吸收部分的更新策略進(jìn)行改進(jìn),用于更新電子狀態(tài)。自適應(yīng)權(quán)重機(jī)制的作用是根據(jù)當(dāng)前搜索狀態(tài)和解的情況,動(dòng)態(tài)調(diào)整光子發(fā)射和吸收的權(quán)重,使得算法能夠更好地平衡探索和利用的能力,更有效地搜索解空間;通過引入反向?qū)W習(xí)機(jī)制,電子的位置將根據(jù)光子發(fā)射和吸收的結(jié)果進(jìn)行更新,這種更新機(jī)制使得電子能夠更快地朝著更優(yōu)解的方向移動(dòng),從而加速算法的收斂。
表3 2種算法模型的迭代次數(shù)和適應(yīng)度Table 3 Iteration times and fitness of the two models
對(duì)故障特征參數(shù)的樣本數(shù)據(jù)進(jìn)行訓(xùn)練后,將其余400 組測(cè)試集數(shù)據(jù)輸入3 種模型,得到的測(cè)試集的故障診斷分類結(jié)果見表4。
表4 3種算法模型診斷結(jié)果Table 4 Diagnostic accuracy of the three models
(1)在相同樣本數(shù)據(jù)集下,IAOS-RF 算法模型的診斷精度達(dá)到了98.00%,略高于AOS-RF 的95.00%,二者均遠(yuǎn)高于RF 算法模型的77.25%。這是由于AOS 優(yōu)化了RF 分類器的決策樹數(shù)目和決策樹深度,使得分類器中的決策樹可以更好地將光伏陣列的故障數(shù)據(jù)分解為不同維度的細(xì)節(jié)信息,理論上可以不斷逼近實(shí)際故障類型的輸入輸出非線性映射關(guān)系。
(2)在測(cè)試的400組數(shù)據(jù)中,IAOS-RF 算法模型僅誤診斷8 組數(shù)據(jù),IAOS-RF 算法模型的測(cè)試集預(yù)測(cè)結(jié)果如圖4所示。AOS-RF 算法模型誤診斷20組數(shù)據(jù),傳統(tǒng)RF 模型則誤診斷60 組數(shù)據(jù)。表明改進(jìn)的IAOS 優(yōu)化RF 分類器后,有效增強(qiáng)了故障模型的分類診斷能力,在區(qū)域搜索過程中收斂速度和適應(yīng)度均得到了一定提升,因此可以更準(zhǔn)確地對(duì)光伏系統(tǒng)故障進(jìn)行診斷。另外,對(duì)于第4種故障,即電網(wǎng)異常故障,IAOS-RF 算法和AOS-RF 算法的誤診率均為最高。究其原因,可能是樣本不平衡以及算法對(duì)特定故障類型的魯棒性不足等。
針對(duì)這些問題,提出以下能增強(qiáng)算法對(duì)各種故障類型適應(yīng)能力的方法。
圖4 IAOS-RF算法模型測(cè)試集預(yù)測(cè)結(jié)果Fig.4 Predicted results of the testing set by IAOS-RF algorithm
(1)數(shù)據(jù)清洗和預(yù)處理。引入更多的數(shù)據(jù)清洗和預(yù)處理步驟,減少噪聲,處理缺失數(shù)據(jù)等,以提高算法對(duì)數(shù)據(jù)質(zhì)量的魯棒性并降低誤診斷的風(fēng)險(xiǎn)。
(2)特征選取和特征工程。使用領(lǐng)域?qū)<业戎R(shí),結(jié)合模型進(jìn)行自動(dòng)篩選和特征提取,進(jìn)一步改善特征表示能力,優(yōu)化特征選擇的過程。
針對(duì)光伏系統(tǒng)故障難以被準(zhǔn)確高效地診斷和分類問題,利用IAOS-RF 算法模型對(duì)光伏系統(tǒng)進(jìn)行故障診斷,得到如下結(jié)論。
(1)IAOS具有更強(qiáng)的尋優(yōu)能力和更快的收斂速度,可有效對(duì)光伏系統(tǒng)故障進(jìn)行診斷,不受模型其他參數(shù)影響。
(2)相較于傳統(tǒng)RF 和AOS-RF 算法模型,IAOS-RF 算法模型可以更加迅速準(zhǔn)確地識(shí)別出光伏陣列的各類故障,在故障診斷效率和精度上都有明顯的優(yōu)勢(shì)。
(3)利用IAOS-RF 算法建立基于數(shù)據(jù)驅(qū)動(dòng)的診斷模型,在樣本有限的情況下具有良好的泛化能力,能夠有效提高光伏發(fā)電陣列故障分類的準(zhǔn)確性,仿真證明該方法的故障診斷準(zhǔn)確率可達(dá)98%。
IAOS-RF 算法在光伏系統(tǒng)故障診斷方面取得了顯著的成果,但仍存在一些局限性和改進(jìn)空間,需要進(jìn)一步研究和探討。
(1)在現(xiàn)實(shí)應(yīng)用中,光伏系統(tǒng)故障數(shù)據(jù)可能受到多種因素的影響,如噪聲、缺失數(shù)據(jù)等。因此,如何處理和優(yōu)化這些數(shù)據(jù)質(zhì)量問題以及如何更準(zhǔn)確地選擇和提取故障特征,仍然是一個(gè)值得研究的方向。
(2)盡管IAOS-RF 算法能夠有效地處理光伏系統(tǒng)的故障診斷問題,但結(jié)合其他機(jī)器學(xué)習(xí)方法可能進(jìn)一步提升其性能。例如,可以考慮結(jié)合深度學(xué)習(xí)方法,如卷積神經(jīng)網(wǎng)絡(luò)或循環(huán)神經(jīng)網(wǎng)絡(luò),以便更好地解決特征提取和模式識(shí)別問題。
(3)隨著光伏系統(tǒng)的不斷發(fā)展,其結(jié)構(gòu)和運(yùn)行情況可能變得更加復(fù)雜。如何進(jìn)一步提升IAOSRF算法的泛化能力,以適應(yīng)各種系統(tǒng)結(jié)構(gòu)和工況變化,是未來研究的一個(gè)關(guān)鍵方向。