吳文濤,陳志聰,吳麗君,程樹英,林培杰
(福州大學(xué)物理與信息工程學(xué)院,微納器件與太陽能電池研究所,福建 福州 350108)
隨著不可再生能源的過度利用,環(huán)境問題與能源枯竭等問題的相繼出現(xiàn)[1],人們迫切需要可再生能源. 太陽能以其清潔、環(huán)保、取之不盡用之不竭的優(yōu)點(diǎn)從眾多能源中脫穎而出[2]. 光伏發(fā)電是目前利用太陽能的主流,而光伏陣列是實(shí)現(xiàn)這一轉(zhuǎn)換的核心器件,發(fā)展迅速. 但是光伏陣列需要長(zhǎng)時(shí)間工作在惡劣的自然環(huán)境中,各種故障隨之而生[3]. 這些故障嚴(yán)重地影響著光伏陣列的使用壽命,降低輸出功率,更有可能引發(fā)火災(zāi),威脅生命和財(cái)產(chǎn)安全. 僅僅依靠人工進(jìn)行檢測(cè)故障,極大地增加了成本. 如何有效地檢測(cè)故障并進(jìn)行分類對(duì)于降低維護(hù)成本,提高光伏陣列使用壽命具有十分重要的現(xiàn)實(shí)意義.
近些年來,眾多國(guó)內(nèi)外研究人員對(duì)光伏陣列故障診斷進(jìn)行了大量研究[4]. 對(duì)地電容檢測(cè)(earth capacitance measurements, ECM)[5]難以檢測(cè)早期故障且對(duì)設(shè)備要求較高,紅外圖像檢測(cè)[6]成本高昂且精度較低. 為了檢測(cè)早期故障,同時(shí)降低成本,許多研究者將機(jī)器學(xué)習(xí)應(yīng)用于光伏陣列故障檢測(cè)[7-11]. 但是機(jī)器學(xué)習(xí)算法需要有大量的真實(shí)數(shù)據(jù)進(jìn)行訓(xùn)練以及大量專業(yè)經(jīng)驗(yàn)和手動(dòng)提取特征,不同的光伏陣列可能有所差異,也就導(dǎo)致了其泛化性能較差. 為了解決手動(dòng)提取特征和泛化性差的缺點(diǎn),文獻(xiàn)[12]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)對(duì)時(shí)序時(shí)間信號(hào)進(jìn)行故障診斷,得到了一個(gè)高準(zhǔn)確率的故障診斷模型. 文獻(xiàn)[13]基于RGB圖像和卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行光伏陣列故障檢測(cè)和分類,得到了一個(gè)具有高泛化性能的模型. 同時(shí)淺層學(xué)習(xí)無法解決數(shù)據(jù)中高維、復(fù)雜等問題,而深度學(xué)習(xí)可以自動(dòng)提取特征,很好地解決了這個(gè)問題. 但是深度學(xué)習(xí)需要有大量的真實(shí)數(shù)據(jù)進(jìn)行訓(xùn)練,而光伏電站大部分運(yùn)行在正常狀態(tài)下,故障數(shù)據(jù)較少. 在只有小樣本數(shù)據(jù)時(shí),機(jī)器學(xué)習(xí)算法以及深度學(xué)習(xí)算法難以訓(xùn)練出一個(gè)具有高泛化性能、高穩(wěn)定性的模型.
實(shí)際的光伏故障數(shù)據(jù)樣本少,但是通過電腦仿真建立和實(shí)驗(yàn)室陣列相似的模型可以輕松獲得大量仿真樣本. 仿真數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)具有較高的相似度,但受實(shí)際運(yùn)行環(huán)境的影響,仿真數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)仍有一些差距,機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法難以通過大量的仿真數(shù)據(jù)建立一個(gè)用于檢測(cè)和診斷實(shí)際故障的模型. 針對(duì)以上問題,本研究首先提出了一種改進(jìn)的初始化方法,將從仿真數(shù)據(jù)訓(xùn)練得到的權(quán)重代替隨機(jī)初始化賦值給實(shí)際故障診斷模型. 同時(shí),將殘差連接和密集連接結(jié)合起來構(gòu)造殘差-密集連接網(wǎng)絡(luò),進(jìn)一步提高分類準(zhǔn)確率和收斂速度. 通過對(duì)比改進(jìn)初始化方法、隨機(jī)初始化方法以及密集連接網(wǎng)絡(luò)和殘差網(wǎng)絡(luò),實(shí)驗(yàn)結(jié)果表明,改進(jìn)初始化方法優(yōu)于隨機(jī)初始化方法,同時(shí)提出的算法也優(yōu)于另外兩種算法.
圖1 單二極管模型Fig.1 Single diode model
對(duì)太陽能電池進(jìn)行分析和建模,可將太陽能電池等效成為一個(gè)由光生電流源和一個(gè)二極管并聯(lián)的電路,如圖1所示. 圖中,Rs為串聯(lián)電阻,主要來源于太陽能電池中半導(dǎo)體材料的體電阻、電極和互聯(lián)金屬的電阻以及電極和半導(dǎo)體之間的接觸電阻;Rsh為分流電阻,是由于P-N結(jié)漏電引起的.
在輻照度和溫度一定時(shí),光生電流Iph不變,可以將其看成為一個(gè)恒流源. 由圖1可得到下列公式.
(1)
其中:n為二極管理想因子;Isc為飽和電流;K是玻爾茲曼常數(shù)(1.380 7×10-23J·K-1);q是元電荷常量(1.60 22×10-19C);T是太陽能電池工作時(shí)的溫度.
當(dāng)有多個(gè)太陽能電池串并聯(lián)時(shí),可將公式(1)轉(zhuǎn)換為:
(2)
其中:Ns和Np分別是串聯(lián)太陽能模塊和并聯(lián)組串的個(gè)數(shù).
通過對(duì)光生電流,二極管理想因子, 飽和電流, 串聯(lián)電阻, 分流電阻設(shè)定來建立模型. 考慮到溫度以及輻照度對(duì)于太陽能電池的影響,上述公式將變化為:
(3)
其中:Isc, std是指在標(biāo)準(zhǔn)狀況下(Gstd=1 000 W·m-2,Tstd=25 ℃)的短路電流;T,G分別為實(shí)測(cè)的溫度和輻照度參數(shù);α是光生電流的溫度系數(shù).
常見的故障包括開路故障、短路故障、陰影遮擋以及線路意外老化故障. 本研究光伏面板采用GL-M100的太陽能組件,將6個(gè)組件串聯(lián),后將3個(gè)串聯(lián)組件并聯(lián),共計(jì)18塊太陽能組件.
輻照度為450 W·m-2,溫度為26 ℃下的I-V和P-V特性分別如圖2、 圖3所示.從圖2可見,開路故障的Isc遠(yuǎn)遠(yuǎn)小于正常狀態(tài),Voc與正常情況相比無太大變化,而短路故障的Voc比正常情況下更小,Isc與正常情況無太大變化.部分陰影對(duì)比正常情況,其I-V曲線會(huì)出現(xiàn)突然下降的點(diǎn),隨著陰影面積的變大其下降的就越嚴(yán)重,且從圖3中可以看出陰影下光伏陣列會(huì)出現(xiàn)雙峰.老化故障的Isc、Voc相較于正常沒有太大變化,但是其最大功率在下降,填充因子下降,同時(shí)陣列老化比組件老化下降得更加嚴(yán)重.通過對(duì)正常及各種故障的分析,電壓、電流、溫度、輻照度,最大功率和填充因子特征可以將不同的故障區(qū)分出來,因此選取這6項(xiàng)作為輸入特征.
圖2 I-V特性圖Fig.2 I-V characteristic diagram
圖3 P-V特性圖Fig.3 P-V characteristic diagram
隨著計(jì)算機(jī)視覺和目標(biāo)檢測(cè)的興起,卷積神經(jīng)網(wǎng)絡(luò)(CNN)備受歡迎. 對(duì)比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)具有如下的優(yōu)勢(shì): 1) 減少參數(shù). 由于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)采用的是全連接的形式,要是內(nèi)部神經(jīng)元設(shè)置多一點(diǎn)就會(huì)導(dǎo)致計(jì)算量暴增. 但是卷積神經(jīng)網(wǎng)絡(luò)通過對(duì)上一層的感受野(卷積核在的區(qū)域則被稱之為感受野)和指定大小(通常有1 ×1, 3 ×3, 5 ×5大部分是奇數(shù))的卷積核計(jì)算得來,這就大大地減少了運(yùn)算量,降低了算法的冗余度. 2) 特征共享. 在上一層輸入當(dāng)中某一些區(qū)域是具有相同的特征,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)沒有考慮到這一點(diǎn). 卷積神經(jīng)網(wǎng)絡(luò)通過卷積核將某一區(qū)域的相同特征提取出來并且共享這些特征. 其結(jié)構(gòu)包括: 1) 輸入層. 卷積神經(jīng)網(wǎng)絡(luò)的輸入可以多種多樣,可以輸入一維,二維,三維的數(shù)組. 適應(yīng)絕大部分的輸入數(shù)據(jù). 2) 中間層. 又叫隱含層,包括了卷積層和池化層. 卷積層是整個(gè)卷積神經(jīng)網(wǎng)絡(luò)中最為重要的部分,通常是利用一個(gè)參數(shù)可以學(xué)習(xí)的大小一定的卷積核與輸入矩陣進(jìn)行卷積運(yùn)算,而這個(gè)卷積核會(huì)在輸入矩陣上進(jìn)行滑動(dòng)的. 其公式如下:
yl+1(i,j)=[yl*wl+1](i,j)+bl
(4)
其中:yl+1和yl分別為第l+1層的輸出和輸入,也就是上文所提的特征圖;b為第l+1層的偏差值; *表示卷積運(yùn)算;wl+1為第l+1層的卷積核.
池化層的目的是降低參數(shù)量,通過對(duì)特征圖進(jìn)行壓縮,降低運(yùn)算參數(shù). 采用平均池化是對(duì)卷積核大小范圍內(nèi)的所有參數(shù)求和,再除以卷積核大小作為新的特征. 其公式為:
(5)
其中:h,w分別為卷積核的高度和寬度;i,j為卷積核中第i行和第j列.
在卷積神經(jīng)網(wǎng)絡(luò)的最后是輸出層. 通常會(huì)有1層或者多層的全連接層,將上面的特征圖變?yōu)橐痪S與這些層全連接. 最后根據(jù)任務(wù)的不同連接不同的目標(biāo)函數(shù),Softmax函數(shù)廣泛地應(yīng)用于多分類的任務(wù)中.
卷積神經(jīng)網(wǎng)絡(luò)的層數(shù)對(duì)于網(wǎng)絡(luò)的性能有著重大的影響,層數(shù)越深的網(wǎng)絡(luò)往往有著更強(qiáng)大的特征提取能力. 但是網(wǎng)絡(luò)層數(shù)的加深也帶來了過擬合的問題、梯度消失和梯度爆炸現(xiàn)象,會(huì)導(dǎo)致網(wǎng)絡(luò)模型訓(xùn)練速度慢,在訓(xùn)練集準(zhǔn)確率高于測(cè)試集等問題. 何凱明等[14]提出殘差網(wǎng)絡(luò)(res net, RN), 通過殘差連接解決梯度消失和梯度爆炸的問題,同時(shí)具有降低過擬合,訓(xùn)練速度快等優(yōu)點(diǎn). 殘差結(jié)構(gòu),其表達(dá)式為:
F(X)=F(X)+X
(6)
其中:X是輸入特征圖;F(X)表示經(jīng)過卷積運(yùn)算后的輸出特征圖.
通過殘差連接將輸入和輸出連接起來,可以直接學(xué)到上一層的特征而減低過擬合的影響. 同時(shí)可有效抑制梯度消失和梯度爆炸. 殘差連接的思想被引入到深度學(xué)習(xí)中,大大地提高了模型的訓(xùn)練效率和泛化性能,使網(wǎng)絡(luò)層數(shù)可以近一步加深.
圖4 密集連接結(jié)構(gòu)Fig.4 Dense connection structure
由于殘差連接可能會(huì)導(dǎo)致網(wǎng)絡(luò)信息不流通的缺點(diǎn),Huang等[15]提出密集卷積神經(jīng)網(wǎng)絡(luò)(dense net, DN), 通過密集連接的方式將每一個(gè)卷積層都和其他卷積層進(jìn)行連接,使不同層之間的網(wǎng)絡(luò)信息更加流通. 密集連接結(jié)構(gòu)如圖4所示.
與殘差連接直接讓兩個(gè)特征圖相加不同,密集連接網(wǎng)絡(luò)是通過將特征圖進(jìn)行堆疊作為下一層的輸入,其公式為:
Yk=Lk(X0, …,Xk-2,Xk-1)
(7)
其中:k表示網(wǎng)絡(luò)的第k層,一般采用k=4或5;Lk表示第k層的卷積運(yùn)算;Yk表示第k層的輸出; (*)表示將內(nèi)部所有參數(shù)進(jìn)行堆疊.
密集連接可以改善殘差網(wǎng)絡(luò)帶來的信息不流通的問題,但可能未能學(xué)習(xí)到殘差連接的信息. 因此,提出一種改進(jìn)方法結(jié)合密集連接和殘差連接,既有密集連接的信息流通又有殘差連接的信息. 且采用堆疊一次的密集連接,即k=2,這樣做不僅大大地減少了計(jì)算參數(shù),提高了運(yùn)算速度,也避免了過度堆疊造成的特征冗余的問題. 其結(jié)構(gòu)如圖5所示. 先通過殘差連接將輸入和輸出相加而后在通過密集連接將輸入和殘差連接后的特征圖堆疊作為輸出,兼具有殘差連接和密集連接的優(yōu)點(diǎn).
圖5 殘差-密集連接結(jié)構(gòu)Fig.5 Residual dense connection structure
圖6 改進(jìn)初始化方法Fig.6 Improved initialization method
隨機(jī)初始化是深度學(xué)習(xí)中常用的初始化方法,通過對(duì)網(wǎng)絡(luò)模型隨機(jī)賦予初始值而后通過反向傳播的方法來進(jìn)行訓(xùn)練和調(diào)整初始值. 但是初始化對(duì)于深度學(xué)習(xí)十分重要,同一個(gè)網(wǎng)絡(luò)模型在不同的初始值下可能會(huì)跑出一個(gè)很好的擬合而另一個(gè)可能會(huì)完全不會(huì)擬合的情況,因此初始化方式對(duì)深度學(xué)習(xí)的模型具有十分重要的作用. 在實(shí)際過程中,光伏陣列大部分運(yùn)行在正常狀態(tài)而故障數(shù)據(jù)較少,難以通過大樣本訓(xùn)練來獲得高泛化性能的模型. 而通過電腦仿真則可以獲得大量數(shù)據(jù),先用仿真數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)模型,由于仿真數(shù)據(jù)樣本大可以獲得一個(gè)具有高泛化性能的網(wǎng)絡(luò)模型,而后將該權(quán)重賦給實(shí)測(cè)數(shù)據(jù)的模型, 如圖6所示. 通過這樣的方法進(jìn)行初始化不僅改善了隨機(jī)初始化所導(dǎo)致的同一模型得出不同結(jié)果的情況,也可以通過小樣本訓(xùn)練得到一個(gè)高泛化性能的模型,具有實(shí)際應(yīng)用的價(jià)值.
光伏陣列的日常發(fā)電過程中,容易出現(xiàn)短路故障、開路故障、陰影狀況以及老化故障. 其中短路故障是光伏陣列兩個(gè)點(diǎn)出現(xiàn)意外的短路. 開路故障是由于光伏陣列出現(xiàn)意外斷路使得原來連接的線路斷開,降低了輸出功率,陰影狀況可能是由于飛鳥的羽毛和樹木的遮擋等造成光伏面板輻照度不一致的問題,降低了光伏陣列的輸出功率同時(shí)也可能造成熱斑損害太陽能面板,老化故障是由于線路意外暴露而造成的,提高了功率損耗. 本研究重點(diǎn)為設(shè)計(jì)短路故障、開路故障、陰影狀況以及老化故障,因?yàn)閭鹘y(tǒng)方法難以在早期檢測(cè)出這些故障. 創(chuàng)建的具體故障包括: 短路1塊太陽能模塊; 開路一個(gè)組串; 組串老化4 Ω和陣列老化4 Ω; 陰影故障,陰影組件的數(shù)量為1塊,2塊和3塊.
通過Simulink建模仿真獲得仿真數(shù)據(jù). 實(shí)驗(yàn)選擇在晴天進(jìn)行,對(duì)光伏陣列進(jìn)行I-V曲線掃描獲得實(shí)測(cè)數(shù)據(jù),并將所得的數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,其分布如表1所示.
訓(xùn)練集共有140個(gè)訓(xùn)練樣本,測(cè)試集共有2 513個(gè)樣本,通過小樣本訓(xùn)練來模擬實(shí)際情況中數(shù)據(jù)難以獲得的情況. 其訓(xùn)練準(zhǔn)確率如圖7所示. 3種網(wǎng)絡(luò)對(duì)比只有網(wǎng)絡(luò)結(jié)構(gòu)不一樣,其他的數(shù)據(jù)預(yù)處理、數(shù)據(jù)分布、訓(xùn)練步驟等參數(shù)均一致,保證控制變量. 隨機(jī)初始化的網(wǎng)絡(luò)結(jié)構(gòu)為殘差-密集連接網(wǎng)絡(luò). 可以從圖7中明顯看出,改進(jìn)初始化在訓(xùn)練集收斂速度和訓(xùn)練穩(wěn)定性高于隨機(jī)初始化. 這說明改進(jìn)初始化的方法具有收斂速度快,高泛化性能的優(yōu)點(diǎn). 而3種網(wǎng)絡(luò)結(jié)構(gòu)在訓(xùn)練集上無明顯的差異.
表1 數(shù)據(jù)分布表
圖7 實(shí)測(cè)數(shù)據(jù)訓(xùn)練集準(zhǔn)確率Fig.7 Accuracy of training set of measured data
表2是重復(fù)實(shí)驗(yàn)的統(tǒng)計(jì)表,對(duì)于殘差-密集連接網(wǎng)絡(luò),密集連接網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)是通過對(duì)仿真數(shù)據(jù)預(yù)訓(xùn)練5次建立5個(gè)模型而后每個(gè)模型獨(dú)立重復(fù)實(shí)驗(yàn)10次以驗(yàn)證每個(gè)模型的性能. 隨機(jī)初始化則是訓(xùn)練50次.
表2 5次預(yù)訓(xùn)練10次獨(dú)立重復(fù)實(shí)驗(yàn)統(tǒng)計(jì)表
從表2可見,隨機(jī)初始化的測(cè)試集準(zhǔn)確率最高為95.86%而最低準(zhǔn)確率只有70.55%,這就驗(yàn)證了之前的說法. 即同一個(gè)模型,隨機(jī)初始化可以得到一個(gè)較好的模型,也有可能得到一個(gè)差的模型,其穩(wěn)定性和泛化性能較差. 改進(jìn)的初始化方法其性能要優(yōu)于隨機(jī)初始化方法. 同時(shí),對(duì)比3種不同的網(wǎng)絡(luò)結(jié)構(gòu)可以發(fā)現(xiàn),殘差網(wǎng)絡(luò)最低準(zhǔn)確率為81.22%. 這就說明殘差連接有時(shí)會(huì)導(dǎo)致信息不流通而使得模型性能下降. 密集連接網(wǎng)絡(luò)平均準(zhǔn)確率高達(dá)98.26%,準(zhǔn)確率最低也有96.58%. 就說明相對(duì)于殘差網(wǎng)絡(luò),密集連接網(wǎng)絡(luò)信息更加流通. 殘差-密集連接網(wǎng)絡(luò)在測(cè)試時(shí)各方面的表現(xiàn)均為最優(yōu),說明其結(jié)構(gòu)信息流通高于殘差網(wǎng)絡(luò),也比密集連接網(wǎng)絡(luò)多學(xué)習(xí)到殘差信息,進(jìn)一步說明殘差-密集連接具有高穩(wěn)定性和高泛化性能.
提出一種利用改進(jìn)初始化的殘差-密集連接網(wǎng)絡(luò)設(shè)計(jì)光伏陣列故障診斷的方法. 首先,對(duì)光伏陣列故障數(shù)據(jù)進(jìn)行特征提取,擇優(yōu)選取輸入特征. 其次,通過不同方法多次實(shí)驗(yàn)仿真采集的數(shù)據(jù)求取平均準(zhǔn)確率來驗(yàn)證所提方法的性能. 其中,本改進(jìn)初始化網(wǎng)絡(luò)的平均準(zhǔn)確率為98.63%,高于隨機(jī)初始化網(wǎng)絡(luò)的89.33%,殘差網(wǎng)絡(luò)的95.53%和密集連接網(wǎng)絡(luò)的98.26%,證明本改進(jìn)網(wǎng)絡(luò)是具有高泛化性能、高準(zhǔn)確性的網(wǎng)絡(luò)結(jié)構(gòu).