曾祥燕,趙良忠,李冰,李琳
(1.邵陽(yáng)學(xué)院生物與化學(xué)工程系,湖南 邵陽(yáng) 422000;2.華南理工大學(xué)輕化工研究所, 廣東 廣州 510640)
?
蠟樣芽孢桿菌DM423生物量的延遲神經(jīng)網(wǎng)絡(luò)軟測(cè)量
曾祥燕1,趙良忠1,李冰2*,李琳2
(1.邵陽(yáng)學(xué)院生物與化學(xué)工程系,湖南 邵陽(yáng) 422000;2.華南理工大學(xué)輕化工研究所, 廣東 廣州 510640)
摘 要:為探索蠟樣芽孢桿菌DM423有效的生物量在線測(cè)量方法,應(yīng)用延時(shí)神經(jīng)網(wǎng)絡(luò)對(duì)分批培養(yǎng)過(guò)程中DM423的生物量進(jìn)行軟測(cè)量,構(gòu)建了拓?fù)浣Y(jié)構(gòu)為11–20–1的延時(shí)神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)的輸入量為pH、溫度、溶氧量和葡萄糖濃度在t–1與t–2時(shí)的延時(shí)量以及生物量濃度在t–1、t–2和t–3時(shí)的延時(shí)量,輸出量為t時(shí)刻的生物量濃度。結(jié)果表明,構(gòu)建網(wǎng)絡(luò)的泛化能力較好,測(cè)試樣本的均方差為0.15×10–3,所建立的延時(shí)神經(jīng)網(wǎng)絡(luò)具有良好魯棒性和一步預(yù)測(cè)能力,而多步預(yù)測(cè)能力不太理想。
關(guān) 鍵 詞:延時(shí)神經(jīng)網(wǎng)絡(luò);蠟樣芽孢桿菌DM423;生物量;軟測(cè)量
投稿網(wǎng)址:http://xb.ijournal.cn
蠟樣芽孢桿菌DM423 (Bacillus cereus DM423)活菌制劑是一種新型的抗生素替代劑[1],目前已被農(nóng)業(yè)部生物制品規(guī)程委員會(huì)批準(zhǔn)列入“獸醫(yī)生態(tài)劑”,用作畜牧飼料添加劑。微生物發(fā)酵過(guò)程中某些關(guān)鍵生物量參數(shù)難以實(shí)時(shí)在線檢測(cè),一般是通過(guò)定時(shí)取樣后,在實(shí)驗(yàn)室通過(guò)離線分析化驗(yàn)獲得,這樣不但影響了系統(tǒng)的實(shí)時(shí)控制效果,而且使整個(gè)生產(chǎn)過(guò)程難以實(shí)現(xiàn)及時(shí)、準(zhǔn)確的控制與優(yōu)化。尋找可靠的生物量在線測(cè)量方法是擴(kuò)大DM423生產(chǎn)并獲得高活性菌體所亟待解決的問(wèn)題。近年來(lái),基于人工神經(jīng)網(wǎng)絡(luò)的生物量軟測(cè)量[2]方法受到科研工作者的重視。黃永紅等[3]采用基于“虛擬子系統(tǒng)”的模糊神經(jīng)網(wǎng)絡(luò)逆系統(tǒng)軟測(cè)量方法對(duì)關(guān)鍵生物量參數(shù)進(jìn)行在線估計(jì)。房慧等[4]采用模糊徑向基函數(shù)–神經(jīng)網(wǎng)絡(luò)(RBF–NN)構(gòu)建青霉素發(fā)酵的軟測(cè)量模型,同時(shí)結(jié)合改進(jìn)粒子群優(yōu)化訓(xùn)練算法(PSO),建立了青霉素反應(yīng)過(guò)程的軟測(cè)量模型,并對(duì)發(fā)酵工藝進(jìn)行了仿真試驗(yàn)研究,所建模型的預(yù)測(cè)值與實(shí)際測(cè)量值的擬合程度較好,訓(xùn)練過(guò)程滿足要求。
目前,對(duì)微生物培養(yǎng)過(guò)程中的軟測(cè)量大多采用多層靜態(tài)前饋神經(jīng)網(wǎng)絡(luò)模型[5]。楊強(qiáng)大等[6]利用徑向基(RBF)神經(jīng)網(wǎng)絡(luò)分別為發(fā)酵過(guò)程各階段建立了軟測(cè)量模型,能較好地對(duì)諾西肽發(fā)酵過(guò)程中的產(chǎn)物濃度和培養(yǎng)基濃度進(jìn)行在線測(cè)量。然而,微生物培養(yǎng)過(guò)程本身是動(dòng)態(tài)的,培養(yǎng)基和產(chǎn)物的濃度時(shí)刻都在發(fā)生變化,在培養(yǎng)條件發(fā)生較大波動(dòng)時(shí),所得到的穩(wěn)態(tài)模型無(wú)法準(zhǔn)確反映出輸入和輸出之間的關(guān)系,必須采用動(dòng)態(tài)模型[7–9]才能解決此問(wèn)題。延時(shí)神經(jīng)網(wǎng)絡(luò)(time-delay neural network)由Lang和Hinton[10]于1988年最先提出,是目前流行的處理動(dòng)態(tài)系統(tǒng)的技術(shù),其優(yōu)點(diǎn)是能利用現(xiàn)有的輸入和輸出數(shù)據(jù),算法成熟,網(wǎng)絡(luò)模型收斂性好。筆者擬采用延時(shí)神經(jīng)網(wǎng)絡(luò)對(duì)DM423培養(yǎng)過(guò)程進(jìn)行建模,并對(duì)網(wǎng)絡(luò)的魯棒性能及預(yù)測(cè)性能進(jìn)行驗(yàn)證,現(xiàn)將結(jié)果報(bào)道如下。
1.1菌種
蠟樣芽孢桿菌DM423(Baeillus cereus DM423)由華南理工大學(xué)輕工與食品學(xué)院提供。
1.2方法
采用5 L的機(jī)械式攪拌生物反應(yīng)器對(duì)蠟樣芽孢桿菌DM423進(jìn)行分批培養(yǎng)。反應(yīng)器的實(shí)際工作體積為 3 L。共進(jìn)行16批次的培養(yǎng)。在每一次的分批培養(yǎng)中,氣體通入量恒定,pH 和溫度按設(shè)定值在培養(yǎng)過(guò)程中保持不變。pH 的設(shè)定范圍為 6.7~7.2,DM423在培養(yǎng)過(guò)程中產(chǎn)生的酸性物質(zhì),可通過(guò) pH傳感器將信號(hào)傳送到控制器,從而控制蠕動(dòng)泵加入NaOH 進(jìn)行中和。溫度的設(shè)定范圍為 25~40 ℃,通過(guò)反應(yīng)罐體下部的夾套通入不同溫度的水,對(duì)培養(yǎng)液進(jìn)行控溫。每批次共培養(yǎng)12 h,每隔1 h取樣1次。在16個(gè)樣本中,13個(gè)樣本作為訓(xùn)練樣本,剩余3個(gè)樣本作為測(cè)試樣本。為光滑去除數(shù)據(jù)中的測(cè)量噪聲,增加數(shù)據(jù)的可信度,得到較小時(shí)間間隔的數(shù)據(jù),保證訓(xùn)練集具有較廣泛的覆蓋面[11–12],試驗(yàn)運(yùn)用3次樣條插值法獲得以0.5 h為間隔的數(shù)據(jù)。培養(yǎng)液中的溶氧量(DO 值)由溶氧計(jì)測(cè)定。
采用三層(輸入層、隱含層和輸出層)網(wǎng)絡(luò)結(jié)果對(duì)整個(gè)發(fā)酵的動(dòng)態(tài)過(guò)程進(jìn)行模擬和仿真。延時(shí)神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)上也與前饋網(wǎng)絡(luò)相似,把時(shí)域信號(hào)展成了空間信號(hào),選用BP神經(jīng)算法。隱層與輸出層均為單極性“S”型函數(shù)。以pH、溶氧量(DO值)、葡萄糖濃度(S)和溫度(T)的延時(shí)量以及生物量濃度(X)的延時(shí)量作為網(wǎng)絡(luò)的輸入變量,對(duì)這些變量進(jìn)行組合,從而構(gòu)建不同的網(wǎng)絡(luò)結(jié)構(gòu)。以當(dāng)前時(shí)刻的生物量X?(t)為網(wǎng)絡(luò)的輸出變量。模型訓(xùn)練5 000次后,記錄訓(xùn)練誤差及測(cè)試誤差。
2.1DM423生物量軟測(cè)量的延時(shí)神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建
以不同輸入變量所構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)及樣本的測(cè)試結(jié)果見(jiàn)表1。
表1 不同輸入變量所構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)及樣本的測(cè)試結(jié)果Table 1 MSE of testing samples and the topology of time-delay neural networks for different sets of input variables
從表1可見(jiàn),第1組網(wǎng)絡(luò)的測(cè)試誤差遠(yuǎn)遠(yuǎn)大于其他網(wǎng)絡(luò)結(jié)構(gòu)的測(cè)試誤差,這是因?yàn)榈?組輸入變量只包括了輸入變量的延時(shí)量,而沒(méi)有將輸出的延時(shí)量引入網(wǎng)絡(luò)。本研究中,DM423培養(yǎng)過(guò)程中當(dāng)前時(shí)刻DM423的生長(zhǎng)是受到前一時(shí)刻微生物生長(zhǎng)情況的影響的,即當(dāng)前時(shí)刻的生物量濃度X(t)與以前時(shí)刻生物量濃度X(t–q)是密切相關(guān)的,因而,將輸出的延時(shí)量引入網(wǎng)絡(luò)不僅是從提高網(wǎng)絡(luò)性能的角度出發(fā),而且從實(shí)際意義上來(lái)說(shuō)也是必要的。
延時(shí)神經(jīng)網(wǎng)絡(luò)是將以前的狀態(tài)參數(shù)“記憶”下來(lái),而網(wǎng)絡(luò)要“記住”以前多遠(yuǎn)的信息才好,這樣就涉及了記憶的“深度”與“分辨率”的問(wèn)題。表1中第3組和第4組、第5組和第6組的輸入變量只相差一個(gè)X(t–3),即第4組及第6組的網(wǎng)絡(luò)引入了輸出參數(shù)t–3時(shí)刻的延時(shí)量,但第3組與第4組的網(wǎng)絡(luò)測(cè)試誤差相同,而第6組比第5組網(wǎng)絡(luò)的測(cè)試誤差稍大。由此可見(jiàn),對(duì)延時(shí)神經(jīng)網(wǎng)絡(luò)而言并不是“記住”越遠(yuǎn)的信息就越好,當(dāng)網(wǎng)絡(luò)的分辨率有限時(shí)遠(yuǎn)離的信息就會(huì)丟失。將第5組和第6組參數(shù)分別作為輸入變量,所構(gòu)建的延時(shí)神經(jīng)網(wǎng)絡(luò)用測(cè)試樣本進(jìn)行檢驗(yàn)時(shí),其均方差(MSE)相差不大,2個(gè)網(wǎng)絡(luò)的泛化能力相近??紤]到第6組參數(shù)包括了生物量濃度t–3時(shí)刻的量,所建網(wǎng)絡(luò)所含的信息較多,而且泛化能力較好,所以,本研究中確定以第6組參數(shù)為輸入變量,所構(gòu)建的延時(shí)神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為11–20–1。
2.2延時(shí)神經(jīng)網(wǎng)絡(luò)的抗擾能力(魯棒性)
為檢測(cè)延時(shí)神經(jīng)網(wǎng)絡(luò)在輸入?yún)?shù)有干擾時(shí)的抗擾能力,將高斯噪聲施加于生物量濃度的測(cè)量值。
對(duì)DM423生物量質(zhì)量濃度的測(cè)量值分別施加均值為0.0,標(biāo)準(zhǔn)差為0.03Xmax、0.05Xmax和0.08Xmax的高斯噪聲干擾,以表1中第6組參數(shù)為輸入變量構(gòu)成的網(wǎng)絡(luò)(11–20–1型)為考察對(duì)象,網(wǎng)絡(luò)對(duì)測(cè)試樣本的MSE值分別為0.16×10–3、0.29×10–3、0.75×10–3,沒(méi)有施加干擾時(shí)的MSE值為0.15×10–3。由此可見(jiàn),隨著所施加的高斯噪聲標(biāo)準(zhǔn)差的增大,測(cè)試樣本的MSE也隨之增大,延時(shí)神經(jīng)網(wǎng)絡(luò)的泛化能力下降。在標(biāo)準(zhǔn)差為0.03Xmax的高斯噪聲干擾下,測(cè)試樣本的MSE與沒(méi)有施加干擾時(shí)的MSE差異不明顯??梢?jiàn),網(wǎng)絡(luò)對(duì)此噪聲有一定的抗擾能力。但對(duì)標(biāo)準(zhǔn)差為0.05Xmax和0.08Xmax的高斯噪聲,網(wǎng)絡(luò)的抵抗能力明顯減弱。
2.3延時(shí)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)能力
以表1中第6組的參數(shù)構(gòu)成的網(wǎng)絡(luò)(11–20–1型)為對(duì)象,考察延時(shí)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)能力。
2.3.1一步預(yù)測(cè)
由表1可知,網(wǎng)絡(luò)模型的輸出與輸入間的關(guān)系可表達(dá)為:
X?(t ) =f [X(t–1),X(t–2),X(t–3),T(t–1),T(t–2),pH(t–1),pH(t–2),DO(t–1),DO(t–2),S(t–1),S(t–2)] (1)
網(wǎng)絡(luò)的輸入是生物量X在t–1、t–2和t–3時(shí)刻的實(shí)測(cè)值,以及T、pH、DO和S在t–1和t–2時(shí)刻的測(cè)量值,網(wǎng)絡(luò)的輸出是生物量當(dāng)前時(shí)刻(t時(shí)刻)的估算值,所以,公式(1)得出的是對(duì)生物量質(zhì)量濃度的一步預(yù)測(cè)值。網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果見(jiàn)圖1。從圖1可見(jiàn),網(wǎng)絡(luò)對(duì)生物量的一步預(yù)測(cè)值與實(shí)測(cè)值能很好的吻合,預(yù)測(cè)誤差小(MSE=0.15×10–3)。
圖1 延時(shí)神經(jīng)網(wǎng)絡(luò)的一步預(yù)測(cè)結(jié)果Fig. 1 One-step-ahead predictions on the testing samples from the time-delay neural network
2.3.2 多步預(yù)測(cè)
公式(1)不能用來(lái)作生物量的多步預(yù)測(cè),因?yàn)閄(t–1)、X(t–2)和X(t–3)是實(shí)際的測(cè)量值。如果要用公式(1)進(jìn)行多步預(yù)測(cè),需用網(wǎng)絡(luò)模型輸出的以前時(shí)刻生物量的預(yù)測(cè)值來(lái)代替生物量的實(shí)際測(cè)量值[13–14],即在公式(1)中以X?(t–1)、X?(t–2)和X?(t–3)代替X(t–1)、X(t–2)和X(t–3)。網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果見(jiàn)圖2。
由圖2可見(jiàn),延時(shí)神經(jīng)網(wǎng)絡(luò)的多步預(yù)測(cè)值與實(shí)際測(cè)量值相差甚遠(yuǎn),其多步預(yù)測(cè)能力差,表明延時(shí)神經(jīng)網(wǎng)絡(luò)處理高階次的非線性問(wèn)題時(shí),其動(dòng)態(tài)處理能力有限,只能進(jìn)行一步預(yù)測(cè)。因多步預(yù)測(cè)要求學(xué)習(xí)過(guò)程能反復(fù)地滾動(dòng)或者以鏈鎖作用方式進(jìn)行,延時(shí)神經(jīng)網(wǎng)絡(luò)則不具備這樣的學(xué)習(xí)過(guò)程,故其多步預(yù)測(cè)精度不理想。
圖2 延時(shí)神經(jīng)網(wǎng)絡(luò)的多步預(yù)測(cè)結(jié)果Fig. 2 Multi-step-ahead predictions on the testing samples from the time-delay neural network
筆者采用動(dòng)態(tài)的延時(shí)神經(jīng)網(wǎng)絡(luò)對(duì)DM423分批培養(yǎng)過(guò)程的生物量進(jìn)行軟測(cè)量。將輸出變量t–1,t–2 及t–3時(shí)刻的狀態(tài)信息引入的延時(shí)神經(jīng)網(wǎng)絡(luò),其泛化能力強(qiáng)于只引入輸入變量t–1時(shí)刻狀態(tài)信息的延時(shí)神經(jīng)網(wǎng)絡(luò)的泛化能力,但并不是“記憶”越多以前的信息,其網(wǎng)絡(luò)性能就越好。對(duì)生物量的測(cè)量值施加均值為0.0,而標(biāo)準(zhǔn)差不同的高斯噪聲的干擾時(shí),延時(shí)神經(jīng)網(wǎng)絡(luò)的測(cè)試誤差隨著高斯噪聲的標(biāo)準(zhǔn)差增大而增大,在小噪聲(std=0.03Xmax)下,測(cè)試誤差變化很小,具有一定的抗干擾能力。延時(shí)神經(jīng)網(wǎng)絡(luò)用于多步預(yù)測(cè)時(shí),其預(yù)測(cè)精度差。鑒于此,延時(shí)神經(jīng)網(wǎng)絡(luò)不適于用來(lái)進(jìn)行多步預(yù)測(cè)。
參考文獻(xiàn):
[1] 張英春,韓雪,單毓娟,等.益生菌抑制致病菌作用的機(jī)制研究進(jìn)展[J].微生物學(xué)通報(bào),2012,39(9):1306–1313.
[2] Cao Pengfe,Luo Xionglin.Modeling of soft sensor for chemical process[J].CIESC Journal,2013,64(3):788–800.
[3] 黃永紅,孫玉坤,王博,等.賴氨酸發(fā)酵過(guò)程關(guān)鍵參數(shù)的模糊神經(jīng)網(wǎng)絡(luò)逆軟測(cè)量研究[J].儀器儀表學(xué)報(bào),2010,31(4):862–867.
[4] 房慧,孫玉坤,嵇小輔.青霉素發(fā)酵過(guò)程的粒子群模糊神經(jīng)網(wǎng)絡(luò)軟測(cè)量[J].自動(dòng)化儀表,2011,32(5):46–52.
[5] Konstantinov K.Yoshida T1 physiological state control offermentation processes[J].Biotechnology and Bioengineering,1989,33(9):1145–1156.
[6] 楊強(qiáng)大,侯新宇.諾西肽發(fā)酵過(guò)程中的分階段軟測(cè)量建模[J].化工學(xué)報(bào),2011,62(6):1612–1619.
[7] 周勇,鄭毅,宋利丹.人工神經(jīng)網(wǎng)絡(luò)與遺傳算法耦合法優(yōu)化輔酶Q10發(fā)酵培養(yǎng)基 [J].中國(guó)生物工程雜志,2013,33(9):73–78.
[8] Bochereau L,Bourgine P,Bouyer F,et al.Using recurrent multiplayer neural networks for simulating batch reactors[J].IEEE International Joint Conference on Neural Networks,1991,2:1512–1517.
[9] Barrera-Cortes J,Baruch I,Vazques C V,et al.Neural model of Cry1A(c) protein produced from a Bt.fed batch fermentation[J].IEEE International Joint Conference on Neural Networks,2001,2:1302–1306.
[10] Lang K J,Hinton G E.The development of the timedelay neural network architecture for speed recognition,Technical report CMU–CS–88–152[D].Pittsburgh:Carnegie-Mellon University,1988.
[11] 劉瑞蘭.軟測(cè)量技術(shù)若干問(wèn)題的研究及工業(yè)應(yīng)用[D].杭州:浙江大學(xué),2004.
[12] 吳孟達(dá),李志祥,宋松和.?dāng)?shù)學(xué)分析[M].長(zhǎng)沙:國(guó)防科技大學(xué),2003.
[13] 李冰,郭祀遠(yuǎn),李琳.DM423搖瓶培養(yǎng)過(guò)程生物量的BP神經(jīng)網(wǎng)絡(luò)軟測(cè)量[J].華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,32(12):11–15.
[14] Zhang D,Sun L,Cao J.Modeling of temperature–humidity for wood drying based on time–delay neural network[J].Journal of Forestry Research,2006,17(2):141–144.
責(zé)任編輯:蘇愛(ài)華英文編輯:梁 和
Time-delayed neural network-based soft sensor for Baeillus cereus DM423 biomass during batch cultivation
Zeng Xiangyan1,Zhao Liangzhong1,Li Bing2*,Li Lin2
(1.Department of Biology and Chemical Engineering,Shaoyang University, Shaoyang, Hunan 422000, China; 2.Institute of Light Industry & Chemical Engineering, South China University of Technology, Guangzhou 510640, China)
Abstract:Baeillus cereus DM423 is a new replacement of antibody in stock breeding. In this paper, the biomass of Baeillus cereus DM423 during batch cultivation was measured by the soft sensor of time-delayed neural network, which was constructed with the topology of 11-20-1, the input variables was delays of pH, temperature, dissolved oxygen, glucose concentration at t–1 and t–2 and delays of biomass concentration at t–1, t–2 and t–3, and the output variable was biomass concentration at present time. The result showed that the constructed network had good generalization with the mean square error of 0.15 ×10–3for the testing samples and good robustness and prediction ability.
Keywords:time-delayed neural network; Baeillus cereus DM423; biomass; soft sensor
中圖分類號(hào):TS202.3; TP183
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1007?1032(2016)02?0208?04
收稿日期:2014–09–23 修回日期:2016–02–28
基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(29876013)
作者簡(jiǎn)介:曾祥燕(1974—),男,湖南邵陽(yáng)人,碩士,副教授,主要從事食品科學(xué)研究,zengxiangyan8@163.co;*通信作者,李冰,博士,教授,主要從事生物與食品化工研究,bli@scut.edu.cn