趙夢薇 蒲笑非 鄭 曉 袁 航 鐘思潔
(核反應(yīng)堆系統(tǒng)設(shè)計技術(shù)重點實驗室,四川 成都610213)
經(jīng)典控制理論三要素包括模型、優(yōu)化和反饋校正。隨著控制過程復(fù)雜性的提高,控制理論的應(yīng)用日益廣泛,但其實際應(yīng)用不能脫離被控對象的數(shù)學(xué)模型,因此,對象模型是優(yōu)化控制的基礎(chǔ),利用控制理論去解決實際問題時,首先需要建立被控對象的數(shù)學(xué)模型。
反應(yīng)堆控制對象具有多變量、非線性、強耦合的特性,控制難度較大,為了進一步提升系統(tǒng)控制性能,建立精確的動態(tài)數(shù)學(xué)模型顯得尤為重要。反應(yīng)堆的辨識是指基于試驗或?qū)嶋H運行數(shù)據(jù),建立反映反應(yīng)堆動態(tài)特性的數(shù)學(xué)模型。
人工神經(jīng)網(wǎng)絡(luò)是模擬人腦思維方式的數(shù)學(xué)模型,反映了人腦功能的基本特征,如并行信息處理、學(xué)習(xí)、聯(lián)想、模式分類、記憶等。理論上神經(jīng)網(wǎng)絡(luò)能逼近任何非線性函數(shù),通過離線和在線學(xué)習(xí)給不確定系統(tǒng)提供了自適應(yīng)和自學(xué)習(xí)的能力,運算快速,且具有強容錯性,可以解決多變量問題。
因此,本文擬采用神經(jīng)網(wǎng)絡(luò)BP算法實現(xiàn)反應(yīng)堆系統(tǒng)參數(shù)的辨識。
反應(yīng)堆核燃料裂變反應(yīng)產(chǎn)生熱量,通過一回路冷卻劑將熱量帶出堆芯,并在蒸汽發(fā)生器的傳熱管中與二回路介質(zhì)進行熱交換,實現(xiàn)一、二回路的能量傳遞,在二回路產(chǎn)生蒸汽驅(qū)動汽輪機發(fā)電。
反應(yīng)堆冷卻劑系統(tǒng)是核動力裝置的主要系統(tǒng),反應(yīng)堆核裂變過程產(chǎn)生能量,在一回路循環(huán)的冷卻劑將堆芯熱量傳遞給蒸汽發(fā)生器二次側(cè)給水,二次側(cè)加熱產(chǎn)生蒸汽,推動汽輪機做功。被二次側(cè)給水冷卻了的反應(yīng)堆冷卻劑再返回堆芯,形成閉環(huán)。當(dāng)二回路負荷發(fā)生變化時,一、二回路能量失去平衡,在控制系統(tǒng)的協(xié)同作用下,核功率、冷卻劑平均溫度、給水流量等相關(guān)參數(shù)逐漸恢復(fù)穩(wěn)定,最終反應(yīng)堆到達新的穩(wěn)態(tài)運行點[1]。
RELAP5是輕水反應(yīng)堆系統(tǒng)瞬態(tài)分析最佳估算程序,是一個通用性非常高且得到行業(yè)認可的反應(yīng)堆系統(tǒng)瞬態(tài)分析程序。本文采用基于RELAP5程序的反應(yīng)堆瞬態(tài)仿真模型作為研究對象,包括了點堆、反應(yīng)堆及一回路主要設(shè)備、直流蒸汽發(fā)生器及其二次側(cè)邊界等?;诖?,本文選取核功率N、二回路負荷Qw、反應(yīng)堆冷卻劑平均溫度Tavg、給水流量Fw、蒸汽流量Fs、穩(wěn)壓器壓力P及主蒸汽壓力Ps為主要辨識參數(shù)。
一般地,系統(tǒng)的輸出通常用過去輸出、過去輸入和現(xiàn)在輸入信息進行描述:
本文中,f(.)為BP神經(jīng)網(wǎng)絡(luò)函數(shù)輸入輸出數(shù)學(xué)關(guān)系。d表示延遲步數(shù),若延遲步數(shù)過小,可能導(dǎo)致數(shù)據(jù)信息覆蓋不全面,若延遲步數(shù)過大,則導(dǎo)致計算成本較高,計算速度較慢。因此,本文選取d=2。
因此,BP神經(jīng)網(wǎng)絡(luò)輸入輸出模型可表示為:
BP神經(jīng)網(wǎng)絡(luò)的基本原理是最速下降法,它的中心思想是調(diào)整權(quán)值使網(wǎng)絡(luò)總誤差最小。網(wǎng)絡(luò)學(xué)習(xí)過程是誤差邊向后傳播邊修正系數(shù)的過程。具體原理如下。
假設(shè)在訓(xùn)練三層網(wǎng)絡(luò)的學(xué)習(xí)階段,輸入層、隱含層、輸出層節(jié)點數(shù)分別為M、N、L。一個樣本p的輸入輸出為{Xp}和{Tp},隱含層的第i個神經(jīng)元在樣本p的作用下輸入為:
式中,是輸入節(jié)點j在樣本p作用時的輸入;wij為輸入層神經(jīng)元j與隱含層神經(jīng)元i之間的連接權(quán)值;θi為隱含層神經(jīng)元i的閾值。
隱含層第i個神經(jīng)元的輸出為:
g(.)表示激活函數(shù)。
隱含層第i個神經(jīng)元的輸出將通過權(quán)系數(shù)向前傳播到輸出層第k個神經(jīng)元,而輸出層第k個神經(jīng)元的總輸入為:
式中,wki為隱含層i與輸出層k之間的連接權(quán)值;θk為輸出層神經(jīng)元k的閾值。
輸出層第k個神經(jīng)元的輸出為:
對于每一樣本p的二次型誤差函數(shù)為:
其中,表示樣本p對應(yīng)的期望輸出。
則系統(tǒng)對所有N個訓(xùn)練樣本的總誤差函數(shù)為:
權(quán)系數(shù)將按照誤差函數(shù)梯度變化的方向反向調(diào)整,使網(wǎng)絡(luò)逐漸收斂。
綜上所述,若神經(jīng)網(wǎng)絡(luò)輸出與期望輸出不一致,則將誤差信號從輸出端反向傳播回來,并在傳播過程中不斷修正加權(quán)系數(shù),直到輸出端輸出與期望值逼近到一定程度為止。對樣本p完成網(wǎng)絡(luò)權(quán)系數(shù)的調(diào)整后,再送入另一樣本模式進行類似學(xué)習(xí),直到完成所有樣本的訓(xùn)練學(xué)習(xí)為止[2]。
選取小范圍正常功率運行區(qū)間[100%FP,90%FP]進行線性變負荷工況仿真。采集每個時刻的核功率、反應(yīng)堆平均溫度、給水流量、蒸汽流量、需求負荷、穩(wěn)壓器壓力及主蒸汽壓力相關(guān)參數(shù),構(gòu)成所需的訓(xùn)練樣本。用于辨識模型的各個分量處在彼此相差很大的數(shù)據(jù)范圍內(nèi),比如冷卻劑平均溫度和一回路核功率,處在小范圍內(nèi)的分量其變化幅度也小,而處在大范圍內(nèi)的分量其變化幅度可能很大。因此,為了消除指標(biāo)之間的量綱影響,有必要采取離差標(biāo)準(zhǔn)化的方法,進行輸入輸出數(shù)據(jù)的歸一化處理[3]。
(1)隱含層數(shù):綜合考慮辨識及數(shù)據(jù)的復(fù)雜程度,本文選取2層隱含層;
(2)輸入層神經(jīng)元:輸入?yún)?shù)的維數(shù)為7;
(3)輸出層神經(jīng)元:輸出參數(shù)的維數(shù)為1;
(4)隱含層神經(jīng)元:在實際設(shè)計中,確定隱含層神經(jīng)元個數(shù)的辦法是:對于給定的輸入輸出模式,通過反復(fù)調(diào)試和對不同神經(jīng)元數(shù)進行訓(xùn)練對比得到合適的值。在實際設(shè)計中,可以采用隱含層神經(jīng)元個數(shù)選擇的經(jīng)驗公式:
其中,m為輸入層神經(jīng)元數(shù),n為輸出層神經(jīng)元數(shù),s為隱含層神經(jīng)元個數(shù),a為1~10之間的常數(shù)[4]。一般在滿足最低神經(jīng)元數(shù)目的條件的情況下,再多加一到兩個神經(jīng)元用來加速誤差的下降速度即可。因此,設(shè)計隱含層有6個神經(jīng)元。
(5)訓(xùn)練函數(shù):選取Levenberg-Marquardt優(yōu)化算法。該方法學(xué)習(xí)速度很快,對于中小模的網(wǎng)絡(luò)來說,是相對較好的一種訓(xùn)練算法;
(6)傳遞函數(shù):采用tansig函數(shù),即雙極sigmoid。表示隱含層輸出為[-1,1]之間的實數(shù)[5];
(7)辨識準(zhǔn)確度:辨識準(zhǔn)確度通過普遍采用的均方根誤差(RMSE)來估計[6]。
采集[100%FP,90%FP]工況變化范圍內(nèi)的數(shù)據(jù),隨機排列所有離線訓(xùn)練樣本,使所需工況范圍均能得到有效覆蓋,讓辨識模型能夠得到充分訓(xùn)練,從而進一步提高辨識的完備性和可靠性。在訓(xùn)練過程中,選取75%的數(shù)據(jù)用于訓(xùn)練,15%的數(shù)據(jù)用于驗證,15%的數(shù)據(jù)用于測試[7]。辨識誤差精度如圖2所示。
圖2 訓(xùn)練誤差
訓(xùn)練后輸入層到隱含層1的權(quán)重和偏置分別為:
隱含層1到隱含層2的權(quán)重和偏置分別為:
隱含層2到輸出層的權(quán)重和偏置分別為:
對100%FP~95%FP線性降負荷工況進行仿真。瞬態(tài)初期,二回路負荷降低,一、二回路熱能失去平衡,在燃料與慢化劑反饋作用下,反應(yīng)堆功率下降,一段時間后,重新達到新的穩(wěn)態(tài)。神經(jīng)網(wǎng)絡(luò)輸出與實際仿真輸出對比曲線如圖3所示。精度誤差如圖4所示。
圖3 輸出對比
圖4 測試誤差
從圖中可知,在100%FP~95%FP線性降負荷的辨識過程中,最大精度誤差小于1.2%FP,因此,辨識精度能夠滿足較基礎(chǔ)的控制需求。
對象模型是優(yōu)化控制的基礎(chǔ),利用控制理論去解決實際問題時,首先需要建立被控對象的數(shù)學(xué)模型,模型的準(zhǔn)確度將直接影響控制效果,因此,針對反應(yīng)堆相關(guān)系統(tǒng)參數(shù),建立較為準(zhǔn)確的模型十分重要。本文基于RELAP5程序的反應(yīng)堆瞬態(tài)仿真模型,采集[100%FP~90%FP]工況下反應(yīng)堆系統(tǒng)相關(guān)參數(shù),通過BP神經(jīng)網(wǎng)絡(luò)實現(xiàn)模型的訓(xùn)練和測試,針對訓(xùn)練好的模型進行100%FP~95%FP小范圍線性降負荷的仿真,結(jié)果表明,基于BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的模型具有較高的精度,能滿足基本控制需求。另外,本文的方法還需進一步深化研究,數(shù)據(jù)量的大小、數(shù)據(jù)的選取以及神經(jīng)網(wǎng)絡(luò)的優(yōu)化是下一步研究方向。