楊玉泉,張仁貢
(1.浙江同濟科技職業(yè)學院,杭州 311231;2.浙江禹貢信息科技有限公司,杭州 310009;3.浙江工業(yè)大學,杭州 310014)
為減少城市及工礦洪澇災害改善水環(huán)境,許多城市、礦山都建設了排澇泵站。隨著泵站綜合效益日益提高,泵站主機組常年在配水調(diào)度需求下運行。主機組是泵站運行安全的重要設備,成為泵站長期穩(wěn)定運行關鍵要素。泵站經(jīng)多年運行,受自然和人為因素作用(制造、安裝、運行管理等),泵站主機組設備常會出現(xiàn)振動、噪聲以及機組故障問題。一個泵站若有多臺機組,還涉及機組的優(yōu)化組合、機組負載均衡以及機組損耗等問題[1]。上述問題的解決都涉及泵站主機組的動力特性研究。但是如何獲取精確的泵站主機組動力特性是一個世界性難題,主要原因有:①我國大部分水泵建設時未考慮安裝在線監(jiān)測儀表,當泵站主機組安裝完成后,無環(huán)境條件再加裝在線監(jiān)測儀表。②泵站主機組動力特性的主要參數(shù)中包含功率、揚程和流量,流量監(jiān)測本身難度較大,尤其是流量的在線監(jiān)測。③泵站主機組動力特性需要在不同揚程條件下的流量數(shù)值,其特性是一個曲面,但為了簡化問題的分析,一般依據(jù)實際情況選取多個典型揚程,功率從0 到額定功率的條件下,獲取流量數(shù)值,形成典型揚程下的動力特性方程。水工模型試驗是解決復雜水力學問題的有效手段,所得到的試驗結(jié)果真實可信。為此,需要做水泵主機組的真機試驗,泵站要在維修工況下安裝試驗儀器,成本高,測量時間長,對整個泵站的運行產(chǎn)生較大影響。綜上所述,尋找一種既可靠安全、又能夠較高精度獲取泵站主機組動力特性的方法具有較高的研究價值和較為廣闊的實用前景。
一般在泵站主機組制造時,先做泵機模型,再對該模型進行模擬試驗得到模型運轉(zhuǎn)綜合特性曲線,以指導泵站主機組的制造和安裝,并作為第一手廠家試驗資料提供給泵站主機組使用單位。從泵站主機組模型運轉(zhuǎn)綜合特性曲線獲得的泵站主機組動力特性在教科書上有一定的介紹,本文簡稱為泵站主機組模型動力特性,該動力特性精度很低,往往與真機動力特性存在很大差距。隨著自動化技術(shù)和物聯(lián)網(wǎng)技術(shù)的發(fā)展,泵站運行基本上都采用自動化,利用物聯(lián)網(wǎng)感知技術(shù)[2],將泵站主機組的運行數(shù)據(jù)存儲在云數(shù)據(jù)庫中,多年運行積累形成了大數(shù)據(jù)[3]。但如何利用運行存儲的大數(shù)據(jù),來不斷修正泵站主機組模型動力特性,使之不斷自學習接近泵站主機組真機動力特性[4],目前,國內(nèi)外尚沒有相關文獻刊載該研究。
為此,筆者依托國家自然基金項目“流程化工業(yè)生產(chǎn)過程中的不確定動態(tài)調(diào)度方法及其應用(60874074)”、浙江省教育廳科研項目“基于大數(shù)據(jù)的杭州七堡排澇泵站運行優(yōu)化研究”(Y201942901)和浙江省水利廳課題“泵站機組異常振動和溫升研究——以七堡排澇泵站為例”(RC1981)的研究,通過泵站主機組模型運轉(zhuǎn)綜合特性曲線獲得泵站主機組模型動力特性,利用大數(shù)據(jù)技術(shù),結(jié)合可拓神經(jīng)網(wǎng)絡方法的動態(tài)修正和逼近,以獲取排澇泵站主機組真機動力特性,并將該方法編譯為計算機動態(tài)鏈接庫(DLL),開發(fā)了“七堡泵站大數(shù)據(jù)倉庫管理信息系統(tǒng)V1.0”(國家軟件著作權(quán)登記號:2018R11L1440166),為下一步開展泵站的主機組振動原因分析、機組優(yōu)化組合以及負荷優(yōu)化調(diào)度奠定基礎[5]。
泵站主機組廠家提供給用戶單位的模型綜合運行特性曲線和獲得的主機組模型動力特性曲線如圖1 所示。功率流量(揚程)特性是主機組模型動力特性的主要特性,以下就以該動力特性為例進行研究。
圖1 水泵運轉(zhuǎn)綜合特性曲線Fig.1 Operation synthesized characteristic curves of hydraulic turbine
教科書中已有將水泵運轉(zhuǎn)綜合特性曲線獲取功率流量(揚程)特性離散數(shù)據(jù)的步驟,本文不再累述。離散數(shù)據(jù)通過最小二乘法進行擬合為樣條三次曲線方程[6],在計算機語言求解中主要采用高斯函數(shù)和牛頓替代法[7],技術(shù)應用常見于文獻。所獲得的方程在界面中繪制,即為圖1。
采用水泵運轉(zhuǎn)綜合特性曲線獲取的水泵主機組模型動力特性對于正在運行的真機而言,精確的是很不夠的。模型機經(jīng)過放大制造、安裝和長期運行,變化比較大。特別是對于大流量等非標準水泵,需要定制生產(chǎn)。故水泵主機組模型動力特性尚不能用于指導水泵的運行[8]。為此,筆者通過計算機監(jiān)控系統(tǒng)的歷史數(shù)據(jù)庫以及云端運行管理數(shù)據(jù)庫抽取實際數(shù)據(jù),對水泵主機組模型動力特性方程進行修正,以提高動力特性精度。水泵主機組的揚程、功率、流量及效率的計算公式為:
式中:Qj為水泵主機的出口流量,m3∕s;Pj為水泵輸入功率,kW;Hj為揚程,m;ηj為水泵的運行效率;j為水泵主機組的編號。
假設在歷史數(shù)據(jù)庫或云端運行管理數(shù)據(jù)庫的大數(shù)據(jù)中抽取到一組數(shù)據(jù),如某主機組的流量Qi和功率Pi,采用三次多項式擬合方程[9]表示為:
而依據(jù)模型動力特性方程獲得流量為:
則它們的誤差為:
兩邊平方可得:
若有在歷史數(shù)據(jù)庫或云端運行管理數(shù)據(jù)庫的大數(shù)據(jù)中抽取到n組數(shù)據(jù),其總誤差平方和為:
根據(jù)最小二乘法原理,當式(6)關于待定系數(shù)a0,a1,a2,a3的偏導數(shù)為零時,總的誤差平方和取到最小值。并采用指數(shù)矩陣表示可得:
式中:Q為主機組的出口流量矩陣;di為主機組的功率矩陣;D表示功率轉(zhuǎn)置矩陣;E 為總誤差平方和;X 為系數(shù)矩陣。于是E 可表示為:
其中:
依據(jù)指數(shù)矩陣計算方法,原數(shù)據(jù)和新數(shù)據(jù)是一個疊加關系,對于大數(shù)據(jù)中抽取所得的一對流量數(shù)據(jù)Q和功率數(shù)據(jù)P,計算可得:
對于原數(shù)據(jù)引入衰減因子α(0 <α <1,可取α=0.95),并與新數(shù)據(jù)合并可得:
于是,對于大數(shù)據(jù)中抽取所得的新數(shù)據(jù)流量Q和功率P,通過以上方法重新擬合新的功率流量(揚程)動力特性方程。
由于泵站主機組的動力特性方程在不同揚程或上下游水位下,具有相同趨勢且不相交的特點(同趨不相交),研究表明所得曲線方程依據(jù)揚程的不同,具有線性等間距的特性(揚程等間距)[10]。由上述的三次指數(shù)矩陣數(shù)據(jù)處理方法可知,該方法是一種靜態(tài)的以點替代點從而帶動整個曲線進行修正的處理方法。該方法的缺點在于:①無法保證動力特性的“同趨不相交”和“揚程等間距”;②僅僅從歷史數(shù)據(jù)庫中抽取數(shù)據(jù)進行修正,無法從后續(xù)不斷運行的數(shù)據(jù)中抽取數(shù)據(jù)而進行動態(tài)連續(xù)修正,使之不斷逼近真機運行特性工況。為此,本文引入一種基于神經(jīng)網(wǎng)絡的動態(tài)可拓訓練修正方法。
目前,隨著大數(shù)據(jù)、云計算、5G、人工智能等技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(Artificial N euron Networks.ANN)[11,12]計算方法逐步得到流行,在使用該方法之前,需要將歷史數(shù)據(jù)庫云端化,并與云端運行管理數(shù)據(jù)合并為統(tǒng)一數(shù)據(jù)倉,本文稱之為泵站云數(shù)據(jù)倉[13]。如何清洗、合并、存儲、量化、歸一等多數(shù)據(jù)倉庫合并技術(shù)需要另外著文論述,本文不做介紹。神經(jīng)網(wǎng)絡方法將模擬人的大腦和神經(jīng)元,將泵站云數(shù)據(jù)倉分為多個神經(jīng)元節(jié)點,利用信息傳輸系統(tǒng)實現(xiàn)并行分布式處理,具有將數(shù)據(jù)進行快速分析、存儲、計算、擬合和閉環(huán)循環(huán),具有自學習和自適應能力,但神經(jīng)網(wǎng)絡方法的缺點在于比較適應于初始值為零或隨機數(shù)據(jù),對于抽取數(shù)據(jù)密集度過高,往往會陷入局部極值或死循環(huán)[14]。為此,筆者受到蔡文教授可拓理論(extension theory)[15]和趙燕偉教授的《可拓設計》[16]等啟發(fā),引入了可拓理論中的元理論,有效地解決了神經(jīng)網(wǎng)絡方法的上述缺點。
泵站云數(shù)據(jù)倉中將不斷產(chǎn)生新的數(shù)據(jù),一旦數(shù)據(jù)觸發(fā)了規(guī)定的閥值,即可作為初始值輸入神經(jīng)網(wǎng)絡系統(tǒng)進行計算,為了避免陷入局部極值或死循環(huán),在定義閥值時引入可拓元理論,即計算舊數(shù)據(jù)與獲取的新數(shù)據(jù)的可拓距,當可拓距滿足條件時再進入神經(jīng)網(wǎng)絡系統(tǒng)進行計算,可拓距可以變換為閥值使用[17]。本研究利用可拓物元模型確定初始權(quán)值,可拓距的計算采用下式:
式中:ED為可拓距;[wU,wL]為可拓物元區(qū)間;x為可拓區(qū)間外待測對象即泵站主機組(或具體的流量、功率、揚程等工況)。
ED 用來判別待測對象x和一個可拓物元區(qū)間[wU,wL]的可拓距。由于在泵站云數(shù)據(jù)倉中存在海量數(shù)據(jù),同時存在多個分類或聚類數(shù)據(jù),例如振動區(qū)間、氣蝕區(qū)域、磨損趨向等聚類,為了辨識多個分類或聚類數(shù)據(jù)并與神經(jīng)網(wǎng)絡的并列分布計算方法相適應,采用一種雙向并列的鏈接結(jié)構(gòu)[18],融入到神經(jīng)網(wǎng)絡計算方法中,不妨稱該算法結(jié)構(gòu)為可拓神經(jīng)網(wǎng)絡雙向并列鏈接結(jié)構(gòu),圖2所示。
圖2 可拓神經(jīng)網(wǎng)絡雙向鏈接拓撲結(jié)構(gòu)Fig.2 Topological structure diagram of extension neural network with bidirectional links
由于采用泵站云數(shù)據(jù)倉的可拓距過濾式閥值數(shù)據(jù)采納方法,所用的神經(jīng)網(wǎng)絡方法是一種具有自適應的非監(jiān)督學習算法,而可拓神經(jīng)網(wǎng)絡雙向并列鏈接結(jié)構(gòu)有效改進了神經(jīng)網(wǎng)絡的非監(jiān)督學習算法,利用可拓距ED 度量聚類中心、符合目標的邊界數(shù)值和初始權(quán)值。
具體方法為:①當可拓距ED 度量通過時,獲取對應初始權(quán)值的樣本,作為第一個樣本,稱之為原始樣本。②在符合目標的邊界數(shù)值的條件下,采用神經(jīng)網(wǎng)絡方法計算原始樣本,每次傳到至下一個神經(jīng)元時,采用可拓距ED 度量聚類中心,避免陷入局部極值或死循環(huán),直到獲得計算最優(yōu)結(jié)果,作為第二個樣本。③第一個樣本和第二個樣本進行可拓距ED 度量,記錄比較后符合條件的樣本。④不斷并行和循環(huán)計算該過程,直到所有樣本數(shù)據(jù)計算完成,進入穩(wěn)定的分類和聚類集合,更新替換原來數(shù)據(jù)樣本集合。若將可拓距ED 度量轉(zhuǎn)換為對應參數(shù)如流量、功率、揚程等數(shù)據(jù)閾值時,可以設置樣本特征的總個數(shù)。由于根據(jù)可拓距原理,當一個數(shù)據(jù)點落在可拓區(qū)間內(nèi)時,則可拓距小于1。
因此,當泵站云數(shù)據(jù)倉獲取n個特征數(shù)據(jù),對于xi={xx1,xx2,…,xxn},則當EDp=min{EDm}>n,則說明了xi不屬于聚類p,需要創(chuàng)建一個新的樣本聚類。如果EDp<n,則樣本xi屬于聚類p,對于聚類p 所對應的樣本需要進行調(diào)整或替換,主要動態(tài)修正樣本的權(quán)值和聚類中心點,如式(18)~(21)。
式中:Mp是為修正后聚類p的新樣本個數(shù)。
如果輸入第i 個新樣本的數(shù)據(jù)物元xi從原聚類O 變換到新聚類k,則修正后調(diào)整聚類O 所相對應的權(quán)值和聚類中心點,如式(22)~(25)所示。
綜上所述,本研究所提出的神經(jīng)網(wǎng)絡可拓訓練方法,將可拓元理論及計算方法融入到神經(jīng)網(wǎng)絡非監(jiān)督學習算法中,經(jīng)過實驗比較可知,其訓練時間平均可提升50%,且容易獲取數(shù)據(jù)庫的數(shù)據(jù)或知識[19]。同時,優(yōu)化了神經(jīng)網(wǎng)絡算法,避免局部收斂,具有穩(wěn)定性和可塑性等特點。值得注意的是,要保持神經(jīng)網(wǎng)絡的良好優(yōu)化計算效果,可拓距的選取非常重要,可拓距與閾值距離參數(shù)緊密關聯(lián),這就使得閾值距離參數(shù)的選取至關重要,因此需要進行不斷試驗研究和較長時間的觀察積累,進行調(diào)整才能結(jié)合實際數(shù)據(jù)實時修正訓練的需要。
杭州市某排澇泵站位于江干區(qū)和睦港出江口,主要承擔上塘河流域防洪排澇,兼顧上塘河流域的環(huán)境景觀配水。共布置7臺10 kV直接啟動的高壓潛水軸流泵,1~4號泵采用1400QZ-130 型,5~7 號泵采用1600QZB-125 型。由于制造、安裝或運行工況偏差(泵站受錢塘江潮位影響,其揚程變化頻繁,變化幅度大)等原因,5 號泵運行狀態(tài)不穩(wěn)定,振動較大,噪音偏高,故障率較高,對整個泵站的安全和優(yōu)化運行及調(diào)度產(chǎn)生較為明顯影響。因此本文取5 號泵為例進行研究,5 號泵設計流量12 m3∕s,設計揚程3.5~6.0 m,轉(zhuǎn)速295 r∕min,電機功率800 kW,葉輪直徑1.54 m,設計運行效率81.3%~84.3%。
依據(jù)5 號泵廠家提供的泵主機組模型運轉(zhuǎn)綜合特性曲線,獲取模型動力特性數(shù)據(jù),然后采用最小二乘法進行擬合,擬合后的方程組如式(26),流量功率動力特性曲線如圖3(a)所示。
圖3 指數(shù)衰減方法修正處理前后曲線Fig.3 Before and after comparisons fixed by Exponential decay method
從圖3(a)可知,在設計揚程3.5~6.0 m 之間,除了3.5和6.0最小和最大揚程外,另取4.1、4.8、5.4 作為典型主機組揚程,從模型運轉(zhuǎn)綜合特性曲線獲取的離散數(shù)據(jù)擬合的流量功率動力特性曲線方程,繪制后可見其趨勢和間隔都不均勻,且各個典型揚程特性的曲線有明顯的相交現(xiàn)象,不符合實際要求,尤其是當揚程為H=3.5 m時,失真特別厲害。
從該泵站云數(shù)據(jù)倉由計算機監(jiān)控系統(tǒng)歷史數(shù)據(jù)庫[20]和泵站標準化運行管理數(shù)據(jù)庫云化合并而成[21,22],從云數(shù)據(jù)倉中挖掘3.5、4.1、4.8、5.4、6.0 m 等典型泵機揚程的真機運行數(shù)據(jù)進行基于三次多項式指數(shù)矩陣處理方法的修正,取矩陣修正系數(shù)α=0.95,修正替代后重新最小二乘法三次多項式擬合后其特性方程如式(26),繪制的曲線如圖3(b)所示。從圖3(b)可知,修正后的方程其曲線有比較明顯的改變,但是3 個典型揚程下的特性曲線雖然不再交叉,但是依然存不等距現(xiàn)象,不符合泵站主機組流量功率動力特性“揚程等間距”的要求。這也是上文所提到的基于三次多項式指數(shù)矩陣處理方法的缺陷,因此需要采用可拓神經(jīng)網(wǎng)絡方法進行進一步動態(tài)數(shù)據(jù)訓練和修正。
按照“同趨不相交”和“揚程等間距”的流量功率動力特性的要求,將3.5、4.1、4.8、5.4、6.0 m 揚程作為泵站數(shù)據(jù)倉觸發(fā)器[23],激發(fā)實時獲取后續(xù)運行樣本,采用可拓神經(jīng)網(wǎng)絡方法進行動態(tài)訓練和修正,經(jīng)過一年多時間的訓練運行,獲得各數(shù)據(jù)樣本98 個,符合可拓距的樣本62 個,選擇符合聚類可更新數(shù)據(jù)樣本54個進行列表,如表1所示。
表1 各典型揚程下的流量功率聚類更新數(shù)據(jù)樣本Tab.1 Cluster updating data samples of traffic and power under each typical head
可拓距調(diào)整每月進行一次,最后經(jīng)過12 次調(diào)整,可拓距閾值距離參數(shù)設置如下:{H ≡3.5}∈[0.02,0.26]、{H ≡4.1}∈[0.27,0.46]、 {H ≡4.8} ∈[0.47,0.65]、 {H ≡5.4}∈[0.66,0.86]、{H = 6.0}∈[0.87,0.98]。
經(jīng)過54個數(shù)據(jù)樣本的可拓神經(jīng)網(wǎng)絡實時訓練修訂后,重新擬合的方程如式(28),特性曲線如圖3(c)。
從圖3(c)可知,泵站主機組流量功率動力特性基本符合“同趨不相交”和“揚程等間距”的要求,符合實際情況。表1 中的數(shù)據(jù)樣本比較集中在中高功率段,且最低揚程和最高揚程兩個典型揚程的數(shù)據(jù)樣本偏少,這與實際運行的工況密集度有關。隨著時間的推移,樣本數(shù)量越來越多的情況下,特性曲線方程也必將越來越符合泵站主機組的實際運行工況,越來越能指導實際運行調(diào)度與決策[24,25]。
采用C++語言將可拓神經(jīng)網(wǎng)絡方法編譯形成DLL動態(tài)鏈接庫文件,嵌入到七堡泵站大數(shù)據(jù)倉庫管理信息系統(tǒng)中,計算結(jié)果可以通過客戶端軟件泵站主機組動力特性分析系統(tǒng)進行展示,系統(tǒng)主界面如圖4。
圖4 泵站主機組動力特性分析系統(tǒng)主界面Fig.4 Cluster updating data samples of traffic and power under each typical head
通過以上研究,得出如下結(jié)論:
(1)通過廠家提供的泵站主機組模型運轉(zhuǎn)綜合特性曲線獲取模型動力特性方程,再通過靜態(tài)和動態(tài)相結(jié)合的方法,逐步獲取泵站主機組真機動力特性方程的方法是可行有效的。
(2)三次指數(shù)矩陣數(shù)據(jù)處理方法可作為靜態(tài)的點數(shù)據(jù)處理,也是不可缺少的中間步驟,它可將真機歷史運行數(shù)據(jù)盡數(shù)挖掘修正的特性曲線方程中,使得曲線方程接近泵站主機組真機動力特性。
(3)神經(jīng)網(wǎng)絡可拓訓練方法是一種在大數(shù)據(jù)技術(shù)基礎下創(chuàng)新的動態(tài)修正方法,是本文研究的核心方法,該方法將可拓理論融入到神經(jīng)網(wǎng)絡方法中,揚長避短,解決了神經(jīng)網(wǎng)絡在本案例優(yōu)化計算中的局部收斂或死循環(huán),在數(shù)據(jù)處理中發(fā)揮出較好的效果。
(4)應用實踐表明,神經(jīng)網(wǎng)絡可拓訓練方法,具有自適應性、自主學習性和可拓性,在泵站主機組動力特性方程的動態(tài)修正應用中是有效而可靠的方法,修正結(jié)果滿足了“同趨不相交”和“揚程等間距”等特性要求。 □