摘要:鋰電池廣泛應(yīng)用于多個領(lǐng)域,但其性能隨時間退化,最終導(dǎo)致失效。為了解決GAN網(wǎng)絡(luò)在時間序列預(yù)測中的模式崩塌問題,本文提出了一種基于WGAN的鋰電池剩余使用壽命預(yù)測方法,該模型以GRU作為生成器和以CNN作為判別器,并在原有的損失函數(shù)基礎(chǔ)上引入L2范數(shù)以提高模型的收斂性,最后通過對抗訓(xùn)練提高預(yù)測精度。使用CALCE鋰電池數(shù)據(jù)集驗證,WGAN模型在MAE、RMSE和R2評價指標(biāo)上均優(yōu)于其他模型,顯示出高預(yù)測精度和良好泛化性。不同訓(xùn)練集占比下WGAN模型仍保持高預(yù)測性能,證明其廣泛的適用性。
關(guān)鍵詞:鋰電池;生成對抗網(wǎng)絡(luò);WGAN;門控循環(huán)單元網(wǎng)絡(luò);卷積神經(jīng)網(wǎng)絡(luò)
中圖分類號:TM912 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2024)22-0019-06
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
0 引言
鋰電池的性能隨時間推移,其性能會退化,導(dǎo)致最終失效。在電池剩余使用壽命(Remaining Useful Life,RUL)預(yù)測研究中通常將電池容量電池健康狀態(tài)的直觀指標(biāo),通常當(dāng)其降至70%~80%時,認(rèn)為電池壽命結(jié)束[1]。
目前的鋰電池剩余壽命預(yù)測方法主要分為基于模型的RUL預(yù)測方法和基于數(shù)據(jù)驅(qū)動的RUL預(yù)測方法[2],基于模型的方法依賴復(fù)雜電池模型,易受噪聲干擾,適應(yīng)性差,且需理解電池內(nèi)部的物理化學(xué)反應(yīng)[3]。數(shù)據(jù)驅(qū)動方法則通過分析電池容量、電流、電壓等數(shù)據(jù),提取健康特征,預(yù)測RUL,且不受電池內(nèi)部模型限制[4]。李練兵等[5]提出基于差分電壓和Elman網(wǎng)絡(luò)的方法,分析差分電壓和充放電曲線,提取電池容量退化特征,構(gòu)建以電池容量為輸出的網(wǎng)絡(luò),提升鋰電池RUL預(yù)測精度。Chen等[6]提出基于Transformer的鋰電RUL預(yù)測法,用自動去噪編碼器(Denoising Auto Encoder,DAE)處理電池容量再生,后用Transformer預(yù)測RUL,表現(xiàn)優(yōu)于傳統(tǒng)算法。吳瓊等[7]提出用遺傳算法優(yōu)化BP網(wǎng)絡(luò)估算鋰電剩余容量,主成分分析降維健康因子,優(yōu)化權(quán)值,預(yù)測RUL。黃凱等[8]提出CEEMDAN-LSTM預(yù)測法,先分解降噪容量序列,再相關(guān)性分析選殘差,用LSTM建模預(yù)測鋰電RUL,精度高。
基于以上分析,提出一種基于生成對抗網(wǎng)絡(luò)的鋰電池RUL預(yù)測方法。該方法構(gòu)建了生成器為GRU,判別器為CNN的Wasserstein生成對抗網(wǎng)絡(luò)(Wasserstein GAN,WGAN)鋰電池剩余使用壽命預(yù)測模型。
1 相關(guān)理論
1.1 門控循環(huán)單元網(wǎng)絡(luò)
門控循環(huán)單元網(wǎng)絡(luò)(Gated Recurrent Unit Network, GRU)是2014年Cho和Chung提出的RNN門控變體[9],比LSTM簡單,參數(shù)少,計算高效,時序任務(wù)表現(xiàn)好。其結(jié)構(gòu)如圖1所示。
重置門Rt和更新門Zt的計算公式如下:
[ [Rt=σ(WrxXt+WrhHt-1+br)] (1) [Zt=σ(WzxXt+WzhHt-1+bz)] (2) ]
其中σ(·)為Sigmoid激活函數(shù),Wrx,Wzx和Wrh,Wzh為各門控結(jié)構(gòu)對應(yīng)輸入值Xt和隱藏狀態(tài)Ht-1的權(quán)重參數(shù),br,bz為各門控結(jié)構(gòu)的偏置參數(shù)。
候選隱藏狀態(tài)[Ht]用于計算隱藏狀態(tài)Ht,具體計算公式如下:
[ [Ht=tanh(WhxXt+Whh(Rt⊙Ht-1)+bh)] (3) ]
式中:tanh(·)為雙曲正切5pOWM7hGOWgFR2uBixkjyDoUNFnxopVLKeWOg5na0sE=激活函數(shù),Whx和Whh為候選隱藏狀態(tài)的權(quán)重參數(shù),bh候選隱藏狀態(tài)的偏置參數(shù),[⊙]表示哈達(dá)瑪積(按元素乘法)。重置門Rt決定了[Ht]的更新是否受前一時刻隱藏狀態(tài)Ht-1的影響。
最后,由更新門Zt和候選隱藏狀態(tài)[Ht]計算隱藏狀態(tài)Ht供輸出層使用,具體計算公式如下:
[ [Ht=Zt⊙Ht-1+(1-Zt)⊙Ht] (4) ]
其中,更新門Zt負(fù)責(zé)調(diào)節(jié)保留自前一時刻隱藏狀態(tài)Ht-1的歷史信息量,以及從候選隱藏狀態(tài)[Ht]接收新信息的比例,進(jìn)而融合這些信息以生成當(dāng)前時刻的隱藏狀態(tài)Ht。
1.2 生成對抗網(wǎng)絡(luò)
生成對抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)[10]由生成器和判別器組成,用于圖像生成,學(xué)習(xí)真實(shí)數(shù)據(jù)分布,判別數(shù)據(jù)真假。GAN廣泛應(yīng)用于圖像、視頻、時間序列預(yù)測等領(lǐng)域。
在生成對抗網(wǎng)絡(luò)的訓(xùn)練過程中,生成器與判別器通過相互競爭達(dá)到一種平衡,類似于博弈論中的“納什均衡”,判別器難以區(qū)分生成器產(chǎn)出的數(shù)據(jù)與真實(shí)數(shù)據(jù)。GAN是一個靈活的生成模型框架,允許內(nèi)部結(jié)構(gòu)的多樣性,可以選擇CNN、RNN、LSTM等不同的網(wǎng)絡(luò)結(jié)構(gòu)來適應(yīng)不同的應(yīng)用需求。GAN模型結(jié)構(gòu)如圖2所示。
模型理想狀態(tài):生成器掌握數(shù)據(jù)分布,生成逼真數(shù)據(jù);判別器在無法辨識數(shù)據(jù)真?zhèn)螘r,其輸出概率為50%。GAN的目標(biāo)函數(shù)如下所示:
[minGmaxDY(D,G)=Ex~Pdata(x)[log(D(x))]+Ex~PG(z)[log(1-D(G(z)))]] (7)
式中,x為輸入數(shù)據(jù),D(x)表示判別器判斷該輸入數(shù)據(jù)為真的概率,G(z)表示生成器根據(jù)隨機(jī)噪聲z生成的虛假數(shù)據(jù)。Pdata(x)表示真實(shí)數(shù)據(jù)的分布,PG(z)是生成器學(xué)習(xí)到的虛假數(shù)據(jù)的分布。E則是計算其期望。公式(7)分兩部分,先k次優(yōu)化判別器D,再優(yōu)化1次生成器G,交替訓(xùn)練。
1.3 Wasserstein生成對抗網(wǎng)絡(luò)
Wasserstein生成對抗網(wǎng)絡(luò)(Wasserstein GAN,WGAN) [11]是對經(jīng)典GAN模型的一個改進(jìn)。其增強(qiáng)了模型的穩(wěn)定性,解決了GAN模式崩塌的問題。WGAN與經(jīng)典GAN模型相比,做出了以下4處優(yōu)化:
(1)判別器輸出層去除sigmoid,將任務(wù)從二分類轉(zhuǎn)為回歸;
(2)損失計算中去除對數(shù),增大損失值以助訓(xùn)練;
(3) 訓(xùn)練判別器時參數(shù)截斷,限制參數(shù)范圍以緩解梯度消失;
(4)棄用動量優(yōu)化,推薦RMSProp或SGD,以提升模型收斂速度。
WGAN中參數(shù)截斷應(yīng)對判別器梯度的Lipschitz限制,確保不超過閾值K。為克服截斷帶來的問題,引入梯度懲罰機(jī)制,以替代固定閾值,既滿足限制也保持了判別器性能。此時判別器的損失函數(shù)如式(8)所示:
[LossD=-Ex~Pr[D(x)]+Ex~Pg[D(x)]+λEx~px?xD(x)p-12] (8)
其中,Pr代表真實(shí)數(shù)據(jù)的概率分布,而Pg代表生成器所模擬的數(shù)據(jù)分布。兩者之間的差異構(gòu)成了分布區(qū)域[px],E用來表示這個區(qū)域的期望值。通過在xr和xg之間進(jìn)行插值[x],引入了介于0到1之間的隨機(jī)變量ε,計算公式如下:
[x=εxr+(1-ε)xg,xr~Pr,xg~Pg,ε~Uniform[0,1]] (9)
2 WGAN模型結(jié)構(gòu)
2.1 生成器結(jié)構(gòu)
本文采用GRU作為生成器的核心網(wǎng)絡(luò)結(jié)構(gòu),利用其穩(wěn)定性優(yōu)勢,并通過全連接層來產(chǎn)生所需的數(shù)據(jù)輸出。針對鋰電池剩余使用壽命預(yù)測,本文采用改進(jìn)的WGAN損失函數(shù),由對抗損失和預(yù)測損失兩部分組成。對抗損失基于WGAN原始損失,促使生成器的數(shù)據(jù)分布與原始數(shù)據(jù)一致;預(yù)測損失衡量生成數(shù)據(jù)與真實(shí)數(shù)據(jù)的誤差。在優(yōu)化問題中,L2范數(shù)常作為正則化項,以防止模型過擬合,因此本文使用L2范數(shù)作為預(yù)測誤差的度量,有助于生成器更準(zhǔn)確地捕捉時間序列的特征和結(jié)構(gòu),提升生成器生成數(shù)據(jù)的質(zhì)量。生成器的損失函數(shù)如公式(10)所示。
[ [lossG=-D(y)+λy-y2] (10) ]
在上式中,λ為權(quán)重,控制對抗損失和預(yù)測損失比例,優(yōu)化訓(xùn)練。[y]為生成器預(yù)測值,y為真實(shí)數(shù)據(jù),[D(y)]是判別器結(jié)果。最小化lossG同時最大化判別器對[y]的判別,減小預(yù)測誤差,實(shí)現(xiàn)收斂。
2.2 判別器結(jié)構(gòu)
本文的WGAN判別器融合了一維卷積神經(jīng)網(wǎng)絡(luò)和全連接層,發(fā)揮了CNN在處理分類任務(wù)時的長處。判別器由三層一維卷積層、最大池化層和兩層全連接層構(gòu)成。為增強(qiáng)訓(xùn)練效能,卷積層中使用了帶泄露的線性整流單元(Leaky ReLU)激活函數(shù),而輸出層則沿用了WGAN模型的線性激活函數(shù)。該線性激活函數(shù)產(chǎn)生的分?jǐn)?shù),量化了生成數(shù)據(jù)與真實(shí)數(shù)據(jù)的相似性。損失函數(shù)則基于Wasserstein距離,用于指導(dǎo)判別器的訓(xùn)練,公式如(11)所示。
[ [lossD=-D(y)+D(y)] (11) ]
上式中,y表示實(shí)際的鋰電池容量數(shù)據(jù),而[y]表示生成器生成的虛假容量數(shù)據(jù)。
訓(xùn)練過程的目標(biāo)是最小化公式(11)定義的損失函數(shù)lossD,這涉及在提升判別器對真實(shí)數(shù)據(jù)D(y)的判別能力的同時,降低其對生成數(shù)據(jù)[D(y)]的判別效果。
3 實(shí)驗結(jié)果與分析
3.1 數(shù)據(jù)集介紹
模型的輸入數(shù)據(jù)來自馬里蘭大學(xué)先進(jìn)生命周期工程研究中心(CALCE) 的鋰電池數(shù)據(jù)集中的CS2_35、CS2_36、CS2_37三個電池的充放電實(shí)驗數(shù)據(jù)[12]。如圖3所示為鋰電池的容量衰退曲線。
3.2 模型訓(xùn)練
本文將從馬里蘭大學(xué)鋰電池數(shù)據(jù)集中所提取的4個特征作為輸入,通過WGAN模型進(jìn)行預(yù)測鋰電池容量數(shù)據(jù)。該模型的結(jié)構(gòu)圖如圖4所示(注:圖中的Bs為批量大?。膱D中可以看出,本文所提出的WGAN模型的生成器有三個GRU層,分別有1 024,512,256個神經(jīng)元;兩個Dense層,分別有128和64個神經(jīng)元。判別器有三個1D卷積層,分別有32,64,128個神經(jīng)元;一個Flatten層。
WGAN的訓(xùn)練過程遵循生成器和判別器交替更新的迭代方法,具體步驟如下:
1) 模型輸入階段:將訓(xùn)練數(shù)據(jù)送入模型。
2) 判別器D更新:固定生成器G的參數(shù),將由G生成的預(yù)測數(shù)據(jù)與實(shí)際數(shù)據(jù)混合后送入判別器D。隨后,利用Adam優(yōu)化算法對D的權(quán)重進(jìn)行調(diào)整。
3) 生成器G更新:保持判別器D參數(shù)不變,將訓(xùn)練數(shù)據(jù)輸入G得到預(yù)測數(shù)據(jù),隨后將這些數(shù)據(jù)與真實(shí)數(shù)據(jù)一起輸入D,以此來評估G生成的數(shù)據(jù)。
4) 迭代優(yōu)化:重復(fù)步驟1至3,G和D的網(wǎng)絡(luò)參數(shù)持續(xù)優(yōu)化,損失函數(shù)值逐漸減小,預(yù)測結(jié)果逐步逼近真實(shí)值。
3.3 模型評價指標(biāo)
模型的預(yù)測結(jié)果,采用平均絕對誤差(Mean Absolute Error,MAE) 、均方根誤差(Root Mean Square Error,RMSE) 和決定系數(shù)(R2 score,R2) 這三個指標(biāo)進(jìn)行評估。其計算公式見式(12)~(14):
[ [RMSE=1nt=1nxt-xt2] (12) [MAE=1nt=1nxt-xt] (13) [R2=1-[t=1nxt-xt2][t=1nxt-xt2]] (14) ]
3.4 實(shí)驗結(jié)果與分析
為了驗證本文選擇GRU作為生成器比LSTM作為生成器的優(yōu)越性,以CS2_35電池為例分析LSTM和GRU的預(yù)測能力。
在LSTM模型中,使用了一層LSTM,模型的優(yōu)化器是Adam算法,學(xué)習(xí)率為0.001。批處理大小是64,然后在訓(xùn)練集上迭代了50次。如圖5所示為LSTM在CS2_35上的預(yù)測結(jié)果圖。
在構(gòu)建GRU模型時,使用了兩層GRU,它的優(yōu)化器為Adam算法,學(xué)習(xí)率為0.000 1,批量大小為32,然后在訓(xùn)練集上迭代了50次。如圖6所示為GRU在CS2_35上的預(yù)測結(jié)果圖。
從圖5和圖6可以看出LSTM與GRU的預(yù)測結(jié)果沒有明顯的差距,LSTM的MAE為0.054 2,而GRU的MAE為0.057 3,兩者之間的差距很小。然而LSTM模型的訓(xùn)練時間為8.561 5 s,GRU模型的訓(xùn)練時間為6.812 s。這說明兩者在預(yù)測精度方面沒有明顯的區(qū)別,但是在訓(xùn)練時間上有不小的差距,為了減少時間開銷,本文的WGAN模型的生成器選擇了GRU。
構(gòu)建GAN和WGAN模型的結(jié)構(gòu)時,模型的生成器是GRU,判別器是CNN,優(yōu)化器是學(xué)習(xí)率為0.000 16的Adam算法。批處理的大小是128,在訓(xùn)練集上迭代了300次。如圖7和圖8所示,分別為GAN和WGAN在CS2_35上的預(yù)測結(jié)果圖。
從圖7和圖8可以看出,WGAN和GAN都具有不錯的預(yù)測精度,但WGAN的預(yù)測效果更好一些。如圖9所示,上方藍(lán)線為判別器的損失曲線,下方橙色線為生成器的損失曲線。在500次迭代后,可以明顯地看出,GAN的判別器的損失曲線一直高于生成器的損失曲線,在100次迭代后趨于穩(wěn)定,而WGAN的判別器的損失曲線隨著迭代次數(shù)的增加,逐漸減小,直到趨近于0。與GAN模型相比,WGAN的判別器的學(xué)習(xí)能力更強(qiáng),預(yù)測效果也更好。
在訓(xùn)練集和測試集各占數(shù)據(jù)集的50%情況下,四種模型在CS2_35、CS2_36、CS2_37三個電池上的RUL預(yù)測結(jié)果的評價指標(biāo)如表1所示。
通過表1可觀察到WGAN模型在對CS2_35、CS2_36和CS2_37電池的RUL進(jìn)行預(yù)測時,其表現(xiàn)優(yōu)于其他三種模型。WGAN模型的MAE和RMSE都顯著低于GRU、LSTM和傳統(tǒng)GAN模型,表明WGAN模型在預(yù)測鋰電池的RUL時,能夠提供更為精確的估計,誤差更小,擬合度更高。R2值越高,表明模型的預(yù)測值與實(shí)際值之間的相關(guān)性越強(qiáng),預(yù)測的可信度和準(zhǔn)確性越高。WGAN模型的R2值在所有模型中是最高的,這意味著其預(yù)測結(jié)果與實(shí)際值更為貼近。
通過圖10可以觀察到WGAN模型的預(yù)測曲線緊密貼合實(shí)際的電池容量退化曲線,顯示出其在捕捉電池容量波動趨勢方面的高準(zhǔn)確度。隨著電池循環(huán)次數(shù)的增加,WGAN模型依然能夠維持較高的預(yù)測精度,而GRU、LSTM和傳統(tǒng)GAN模型的預(yù)測曲線則逐漸偏離實(shí)際曲線,顯示出它們的擬合效果隨著時間的推移而下降。
進(jìn)行鋰電池RUL預(yù)測時,WGAN模型在不同規(guī)模的訓(xùn)練集上的表現(xiàn)是評估其泛化能力和魯棒性的關(guān)鍵。通過將數(shù)據(jù)集分別劃分為40%、50%和60%作為訓(xùn)練集,能夠深入理解WGAN模型在不同訓(xùn)練數(shù)據(jù)條件下的預(yù)測能力。不同訓(xùn)練集下的預(yù)測結(jié)果如圖11所示。
由圖11可知,隨著訓(xùn)練集規(guī)模的增加,WGAN模型的預(yù)測精度逐漸提高。在40%訓(xùn)練集中,WGAN模型能夠捕捉到電池容量的大致退化趨勢。當(dāng)訓(xùn)練集為50%時,WGAN模型的預(yù)測曲線與實(shí)際曲線的吻合度提高,具有更好的擬合效果。當(dāng)訓(xùn)練集為60%時,WGAN模型的預(yù)測精度更高,預(yù)測曲線幾乎與實(shí)際曲線重合,這表明WGAN模型在較大訓(xùn)練集的支持下能夠?qū)崿F(xiàn)高度精確的RUL預(yù)測。
從表2中可以看出,隨著訓(xùn)練集的增加,MAE和RMSE逐漸減小,而R2值逐漸增大,這與圖11的觀察結(jié)果一致。較小的訓(xùn)練集可能導(dǎo)致模型欠擬合,而較大的訓(xùn)練集則有助于模型更好地學(xué)習(xí)數(shù)據(jù)中的模式,從而提高預(yù)測的準(zhǔn)確性和可靠性。
因此,WGAN模型在不同訓(xùn)練集規(guī)模下的RUL預(yù)測測試結(jié)果表明,該模型具有良好的泛化能力和適應(yīng)性。
4 結(jié)論
為了對鋰電池RUL準(zhǔn)確預(yù)測,本文提出了基于生成對抗網(wǎng)絡(luò)的鋰電池剩余使用壽命預(yù)測模型。該模型首先使用作為生成器的GRU進(jìn)行預(yù)測,再使用作為判別器的CNN進(jìn)行判別,根據(jù)判別器的反饋,更新生成器的訓(xùn)練參數(shù),以生成質(zhì)量更高的數(shù)據(jù)來訓(xùn)練判別器的識別能力;這種對抗訓(xùn)練的過程不斷迭代,使得模型持續(xù)優(yōu)化,最終得到鋰電池RUL的預(yù)測結(jié)果。實(shí)驗結(jié)果表明WGAN具有更低的預(yù)測誤差,WGAN模型在不同數(shù)據(jù)集上的RUL預(yù)測都有較好的準(zhǔn)確性,證明該模型的鋰電池RUL預(yù)測精度更高,泛化性更強(qiáng)。
參考文獻(xiàn):
[1] 梁海峰,袁芃,高亞靜.基于CNN-Bi-LSTM網(wǎng)絡(luò)的鋰離子電池剩余使用壽命預(yù)測[J].電力自動化設(shè)備,2021,41(10):213-219.
[2] 李超然,肖飛,樊亞翔,等.基于卷積神經(jīng)網(wǎng)絡(luò)的鋰離子電池SOH估算[J].電工技術(shù)學(xué)報,2020,35(19):4106-4119.
[3] 鄭雪瑩,鄧曉剛,曹玉蘋.基于能量加權(quán)高斯過程回歸的鋰離子電池健康狀態(tài)預(yù)測[J].電子測量與儀器學(xué)報,2020,34(6):63-69.
[4] 裴洪,胡昌華,司小勝,等.基于機(jī)器學(xué)習(xí)的設(shè)備剩余壽命預(yù)測方法綜述[J].機(jī)械工程學(xué)報,2019,55(8):1-13.
[5] 李練兵,李思佳,李潔,等.基于差分電壓和Elman神經(jīng)網(wǎng)絡(luò)的鋰離子電池RUL預(yù)測方法[J].儲能科學(xué)與技術(shù),2021,10(6):2373-2384.
[6] CHEN D Q,HONG W C,ZHOU X Z.Transformer network for remaining useful life prediction of lithium-ion batteries[J].IEEE Access,1975,10:19621-19628.
[7] 吳瓊,徐銳良,楊晴霞,等.基于PCA和GA-BP神經(jīng)網(wǎng)絡(luò)的鋰電池容量估算方法[J].電子測量技術(shù),2022,45(6):66-71.
[8] 黃凱,丁恒,郭永芳,等.基于數(shù)據(jù)預(yù)處理和長短期記憶神經(jīng)網(wǎng)絡(luò)的鋰離子電池壽命預(yù)測[J].電工技術(shù)學(xué)報,2022,37(15):3753-3766.
[9] 邱錫鵬.神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)[J].中文信息學(xué)報, 2020(7):1.
[10] LINTING M,VAN DER KOOIJ A.Nonlinear principal components analysis with CATPCA:a tutorial[J].Journal of Personality Assessment,2012,94(1):12-25.
[11] ARJOVSKY M, CHINTALA S, BOTTOU L. Wasserstein generative adversarial networks[C]//International conference on machine learning. PMLR, 2017: 214-223.
[12] 史永勝,施夢琢,丁恩松,等.基于CEEMDAN-LSTM組合的鋰離子電池壽命預(yù)測方法[J].工程科學(xué)學(xué)報,2021,43(7):985-994.
【通聯(lián)編輯:李雅琪】