王夢蝶,王俊玲, 于成波(.哈爾濱工程大學(xué) 核安全與仿真技術(shù)國防重點(diǎn)學(xué)科實(shí)驗(yàn)室,哈爾濱5000; .中國核動力研究設(shè)計(jì)院,成都 6004)
我國的核電技術(shù)日趨成熟,由國家自主研發(fā)的“華龍一號”已成為新的“中國名片”走向世界[1].在核電迅速發(fā)展的同時,如何確保電站安全運(yùn)行也一直備受關(guān)注.2011年,日本福島的核泄漏事故再次對核電的發(fā)展產(chǎn)生深遠(yuǎn)影響.保障核電站安全運(yùn)行成為了核電發(fā)展過程中最為重要的工作[2].核電站系統(tǒng)中的設(shè)備數(shù)量眾多且冗雜,相關(guān)物理參數(shù)互相耦合.在故障發(fā)生時,操作員很難從眾多變化參數(shù)中準(zhǔn)確分析且判斷故障類型.如果操作員判斷失誤,將會導(dǎo)致事故程度加重,比如美國三里島事故就是因?yàn)椴僮鲉T未能準(zhǔn)確判斷故障原因,從而操作失誤引起堆芯失水[3].若能根據(jù)核電站運(yùn)行中的實(shí)時數(shù)據(jù)進(jìn)行人工智能化參數(shù)預(yù)測,及早發(fā)現(xiàn)異常,實(shí)時了解工況走勢,為操作員提供早期預(yù)警,將降低操作員誤判可能性,確保核電站安全運(yùn)行.
隨著大數(shù)據(jù)時代、數(shù)字化儀表和智能算法的迅速發(fā)展,人工智能相關(guān)方法已經(jīng)應(yīng)用在核電控制系統(tǒng),如故障診斷、狀態(tài)預(yù)測、環(huán)境監(jiān)測等方面[4-6].龔安等人使用長短期記憶方法用于核電裝置主泵電機(jī)溫度預(yù)測[7].A·Zhang等人通過深度學(xué)習(xí)相關(guān)方法對反應(yīng)堆產(chǎn)生的熱功率進(jìn)行預(yù)測[8].J·Yang等人利用自動編碼器和長短期記憶方法對核電站進(jìn)行狀態(tài)監(jiān)測并識別故障類型[9].
深度學(xué)習(xí)不僅應(yīng)用在圖像識別、語音處理上,其自動提取特征的能力還被廣泛應(yīng)用在各領(lǐng)域[10].深度學(xué)習(xí)區(qū)別于傳統(tǒng)的手動選取特征的方法,能夠提取深層次的故障本質(zhì)特征,提高故障診斷的準(zhǔn)確率[11].基于此,本文使用深度學(xué)習(xí)中最為普遍的模型-卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在核電站的主要參數(shù)預(yù)測.通過預(yù)測異常工況下的主冷卻劑系統(tǒng)壓力走勢,了解核電站當(dāng)前狀態(tài),幫助操作員及時處理故障,確保核電站穩(wěn)定運(yùn)行.
近年來,作為深度學(xué)習(xí)應(yīng)用最廣泛的方法之一的卷積神經(jīng)網(wǎng)絡(luò)受到眾多領(lǐng)域研究者的關(guān)注[12-13].不同于常規(guī)的卷積神經(jīng)網(wǎng)絡(luò),本文構(gòu)建的模型不包含池化層,僅利用卷積層進(jìn)行自動特征提取,再通過全連接層達(dá)到預(yù)測目的.
通過對輸入數(shù)據(jù)進(jìn)行卷積運(yùn)算,卷積層自動地提取相應(yīng)事件的深層特征.對于輸入層數(shù)據(jù),卷積運(yùn)算以一定間隔的濾波器滑動,將濾波器內(nèi)元素與局部數(shù)據(jù)對應(yīng)元素相乘后求和得到相應(yīng)的特征值圖,計(jì)算公式如式(1)所示.
(1)
其中:
ha,b為特征值圖中第a行第b列的特征值元素;
f為ReLU非線性激活函數(shù);
wc,d為濾波器中第c行第d列的權(quán)重元素;
xa+c,b+d為第a+c行第b+d列的輸入數(shù)據(jù);
b為權(quán)重偏置值.
卷積層輸出的特征值圖通過展平層進(jìn)行一維化處理.展平層所得的一維特征向量進(jìn)入全連接層進(jìn)行運(yùn)算.全連接層中的結(jié)點(diǎn)與上一層的所有結(jié)點(diǎn)相關(guān)聯(lián),計(jì)算公式如式(2)所示.
zi=f(wi×h+bi)
(2)
其中:
zi為全連接層中第i個元素的特征值;
h為上一層的特征向量;
f為ReLU非線性激活函數(shù);
wi為與第i個元素相關(guān)的權(quán)重值;
bi為與第i個元素相關(guān)的偏置值.
在深度學(xué)習(xí)模型中,為了降低數(shù)據(jù)值分布變化的影響進(jìn)行歸一化處理,將數(shù)據(jù)分布映射在一個特定區(qū)間,比如[0,1]或[-1,1].歸一化的常見方法包含最小-最大歸一化(min-max normalization)、均值歸一化(mean normalization)和標(biāo)準(zhǔn)差歸一化(z-score).z-score方法更適用于特征最小值和最大值都屬于未知,或有離群數(shù)據(jù)超出取值范圍的情況.均值歸一化更適合數(shù)據(jù)中含有負(fù)值的情況,映射到[-1,1]的范圍.最小-最大歸一化適合單一事件并以此為標(biāo)準(zhǔn)進(jìn)行歸一化處理,不適用多個事件的統(tǒng)一處理.
本文通過各個傳感器的特征除以該傳感器訓(xùn)練事件中最大值達(dá)到歸一化目的,以保留各個傳感器的特征信息,數(shù)學(xué)表達(dá)式如式(3)所示.
(3)
測試、驗(yàn)證事件以訓(xùn)練事件中最大值為標(biāo)準(zhǔn),進(jìn)行歸一化處理.
多步窗格所包含的信息量比單步窗格多,窗格滾動更具有實(shí)時性和豐富性,預(yù)測準(zhǔn)確率更高.多步窗格滾動的方式如圖1所示.
其中原始數(shù)據(jù)是多維時間序列,窗口大小為i,原始傳感器個數(shù)為m,預(yù)測傳感器個數(shù)為n.
滾動預(yù)測的時間窗格跨度越大,窗格所包含的信息量越多,但是在異常工況下,參數(shù)值變化快,所以時間窗格i需控制在一定范圍內(nèi).
本文基于CNN的網(wǎng)絡(luò)模型為一層輸入層、一層卷積層、一層展平層、兩層全連接層、一層輸出層,如圖2所示.模型的輸入是多個特定傳感器的時間序列,形成一個類似于圖像的二維矩陣數(shù)據(jù).卷積層包含36個大小為2×2的濾波器,其輸出通過展平后進(jìn)入到兩層神經(jīng)元數(shù)為128的全連接層.ReLU非線性激活函數(shù)為在卷積和全連接的層之后應(yīng)用.輸出層是由數(shù)量等于預(yù)測傳感器數(shù)的神經(jīng)元所組成的全連接層,激活函數(shù)為線性激活函數(shù).構(gòu)建的CNN模型中未考慮池化層,因?yàn)檩斎雽拥臄?shù)據(jù)通過卷積層提取到關(guān)于相鄰傳感器的特征信息,池化層的加入可能會導(dǎo)致傳感器特征值信息的缺失.
圖2 基于CNN的模型結(jié)構(gòu)
平均絕對誤差(Mean Absolute Error,MAE)是絕對誤差的平均值,用于衡量預(yù)測值與實(shí)際值的誤差,表達(dá)式(4)如下所示.
(4)
其中:
xt為t時刻傳感器的實(shí)際讀數(shù);
yt為t時刻模型的預(yù)測值;
K為數(shù)據(jù)預(yù)測點(diǎn)的個數(shù).
通過計(jì)算測試集數(shù)據(jù)的MAE值來評估模型的精準(zhǔn)度.
實(shí)驗(yàn)數(shù)據(jù)來自于美國Micro-Simulation Technology(MST)公司所開發(fā)的模擬仿真與嚴(yán)重事故分析軟件PCTRAN[14-15].本文選自可適用于三回路的PCTRAN,從0 s開始模擬運(yùn)行,每秒輸出93個傳感器參數(shù).選定SBLOCA事件作為研究的異常工況,選擇跟主冷卻劑系統(tǒng)相關(guān)的33個傳感器參數(shù),預(yù)測該工況下主冷卻劑系統(tǒng)壓力的走勢.本文設(shè)定在正常滿功率運(yùn)行50 s后發(fā)生SBLOCA事件,一共運(yùn)行300 s.
將模型的事件除以訓(xùn)練事件中各個傳感器的特征最大值,進(jìn)行歸一化處理,加速訓(xùn)練收斂速度.
本文設(shè)置時間窗格為i=5.根據(jù)數(shù)據(jù)特性,0~4 s的第一個窗格預(yù)測第5 s的主冷卻劑系統(tǒng)壓力值.窗口依次以步長為1 s的方式進(jìn)行滾動,將時長為300 s的事件分割成296個每5 s的局部數(shù)據(jù).
本文使用Python3.6語言和Keras深度學(xué)習(xí)框架來構(gòu)建模型.優(yōu)化算法采用Adam算法,采用的學(xué)習(xí)率為默認(rèn)值0.001,損失函數(shù)采用MAE,設(shè)置迭代次數(shù)為500次.訓(xùn)練事故破口面積為5、10、15 cm2.為測試模型對破口存在差異的事件的適應(yīng)性,對比訓(xùn)練事件的破口范圍對模型的包容性,分別訓(xùn)練單一的破口10 cm2的事件和以5 cm2為遞增的多類破口事件,并選定破口面積為10 cm2事件為驗(yàn)證集.選取500次迭代中驗(yàn)證集損失函數(shù)值最小的一次為最終模型,以防止過擬合現(xiàn)象.選定破口面積為8 cm2和11 cm2事件為測試集,驗(yàn)證模型的泛化能力.
參照文獻(xiàn)[5]中利用LSTM進(jìn)行異常工況下的事件走勢預(yù)測,本文以文獻(xiàn)[5]構(gòu)建的模型進(jìn)行對比研究.表1為各模型迭代500次中的最小損失值,可以看出LSTM_A模型的驗(yàn)證集損失值會比訓(xùn)練集小一個數(shù)量級,原因在于文獻(xiàn)[5]中未使用驗(yàn)證集,且使用Dropout以避免過擬合.而CNN模型的訓(xùn)練損失值與驗(yàn)證損失集相差較小,模型狀況良好.但是相關(guān)損失值不能完全反饋出模型的優(yōu)劣,增加評估指標(biāo)對模型的優(yōu)劣進(jìn)行評判.
表1 模型損失值
根據(jù)SBLOCA其他歷史相關(guān)參數(shù)去預(yù)測主冷卻劑系統(tǒng)壓力的走勢,在缺少主冷卻劑系統(tǒng)壓力的參數(shù)情況下,預(yù)測主冷卻劑壓力的走勢.兩種深度學(xué)習(xí)方法分別對單一破口和多類破口事件進(jìn)行訓(xùn)練,四種模型的評估結(jié)果如表2所示.
表2 模型的實(shí)驗(yàn)評估指標(biāo)值(MAE)
表2中的4種模型對訓(xùn)練事件和測試事件進(jìn)行預(yù)測,計(jì)算出主冷卻壓力預(yù)測值與實(shí)際值在每個時間點(diǎn)的平均絕對誤差.從評估值結(jié)果看,多類CNN模型在不同事件上均具有更小的評估值.CNN_A模型和LSTM_A模型只有在破口面積為10 cm2的訓(xùn)練事件具有更小的評估值,隨破口變化越大,平均絕對誤差值變大.其原因是模型未曾學(xué)習(xí)過其他破口事件,當(dāng)事件相較于訓(xùn)練事件的變化越大,模型預(yù)測值偏離真實(shí)值越多.CNN_B模型和LSTM_B模型因?yàn)閷W(xué)習(xí)的事件范圍較大,適應(yīng)性更強(qiáng),預(yù)測值與真實(shí)值偏差較少.
測試事件進(jìn)入模型中,如圖3、4, 單一模型能預(yù)測出事件走勢,但多類模型學(xué)習(xí)過破口范圍的端點(diǎn)事件,所以對測試事件具有更好的適應(yīng)性.圖4截取事件50~100 s的局部預(yù)測趨勢,能看出多類事件更貼合真實(shí)值.對同一類型的事件,訓(xùn)練事件包含的范圍越廣,越能準(zhǔn)確預(yù)測范圍內(nèi)的未訓(xùn)練事件.
圖3 CNN模型在11 cm2破口下的預(yù)測結(jié)果
圖4 CNN模型在11 cm2破口下的局部事件預(yù)測結(jié)果
即使LSTM模型應(yīng)用在時間序列上具有優(yōu)勢,但從表2的評估值,可以看出絕大部分的LSTM模型輸出的預(yù)測值比CNN模型更偏離真實(shí)值. 對比圖5、6,在單一事件或者多類事件上,CNN模型預(yù)測出的事件趨勢都比LSTM模型具有更強(qiáng)的適應(yīng)性.
圖5 單一事件下,不同模型局部適應(yīng)性對比圖
圖6 多類事件下,不同模型局部適應(yīng)性對比圖
本文基于CNN模型對核電站異常工況進(jìn)行預(yù)測.在數(shù)據(jù)預(yù)處理中,使用多步窗格滾動方法將長時間序列分割成每5 s的局部數(shù)據(jù)并利用訓(xùn)練事件中每個傳感器的參數(shù)最大值進(jìn)行歸一化處理,保留信息特征以增加模型精準(zhǔn)性.多步窗格預(yù)測方法可以在理論上預(yù)測任意時間長度的信息,也可以預(yù)測多個傳感器的實(shí)時數(shù)據(jù).使用卷積層進(jìn)行深層次特征提取,將各傳感器信息相互關(guān)聯(lián),構(gòu)建CNN模型.本文通過實(shí)驗(yàn)證明,LSTM模型和CNN模型在工況預(yù)測中都有很良好的預(yù)測能力.CNN模型相較于LSTM誤差較小,有更優(yōu)秀的預(yù)測結(jié)果.對于不同程度的同一類型事件,訓(xùn)練事件范圍越廣,更能預(yù)測該類型下的事件走勢,減少構(gòu)造其他程度的模型,具有更好的適應(yīng)性.本文證明CNN模型應(yīng)用在核電控制領(lǐng)域中的事件預(yù)測走勢方面具有優(yōu)秀的性能,能幫助核電操作員對當(dāng)前情況進(jìn)行預(yù)測分析.
本文通過核電模擬軟件驗(yàn)證結(jié)果,在后續(xù)工作中可以通過核電站的實(shí)際數(shù)據(jù)驗(yàn)證該模型的實(shí)用性.在實(shí)際應(yīng)用中,找到同一類型事件的適當(dāng)范圍以構(gòu)建最優(yōu)適應(yīng)性的模型并應(yīng)用到其他重要參數(shù)進(jìn)行預(yù)測.