侯奇
(上海海事大學(xué)信息工程學(xué)院,上海 201306)
預(yù)測(cè)微生物學(xué)本質(zhì)上是基于微生物群體對(duì)環(huán)境因素的反應(yīng)可重現(xiàn),利用過(guò)去觀察到的試驗(yàn)數(shù)據(jù)通過(guò)數(shù)學(xué)模型預(yù)測(cè)食物環(huán)境中的微生物行為,并用實(shí)驗(yàn)結(jié)果證明模型所得到的誤差不大于微生物實(shí)驗(yàn)所帶來(lái)的誤差[1]。微生物預(yù)測(cè)的核心是建立有效的模型,近些年,研究者在建模方式上大多都是參數(shù)化的模型,其模型中的參數(shù)沒(méi)有實(shí)際的意義,僅僅是為了結(jié)果在形式上接近實(shí)際數(shù)據(jù),而目前,得益于神經(jīng)網(wǎng)絡(luò)的研究發(fā)展,越來(lái)越多的研究者用神經(jīng)網(wǎng)絡(luò)去建模,并且神經(jīng)網(wǎng)絡(luò)在處理圖片[2]、視頻[3]、音頻[4]等多維度問(wèn)題上面有著強(qiáng)大的應(yīng)用,使得神經(jīng)網(wǎng)絡(luò)在解決多維和建模問(wèn)題上被研究者廣泛采用,本研究就是采用一種改進(jìn)的ELMAN神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行多維建模問(wèn)題,來(lái)解決預(yù)測(cè)微生物學(xué)在建模上一直采用擬s形態(tài)函數(shù)的詬病,并通過(guò)細(xì)菌覓食算法(Bacterial Foraging Algorithm,BFA)對(duì)ELMAN神經(jīng)網(wǎng)絡(luò)進(jìn)一步的優(yōu)化,并將優(yōu)化后的ELMAN網(wǎng)絡(luò)應(yīng)用到微生物生長(zhǎng)預(yù)測(cè)模型中去,提高了其預(yù)測(cè)的精度。
人工神經(jīng)網(wǎng)絡(luò)是模擬動(dòng)物神經(jīng)網(wǎng)絡(luò)的功能、特征、結(jié)構(gòu)而建立的一種數(shù)學(xué)架構(gòu),實(shí)際就是一個(gè)強(qiáng)大的數(shù)學(xué)函數(shù)。ELMAN也是人工神經(jīng)網(wǎng)絡(luò)的一種,包括輸入層、隱含層、承接層和輸出層,其連接權(quán)可以進(jìn)行學(xué)習(xí)修正,關(guān)聯(lián)層的作用是通過(guò)聯(lián)接記憶將上一個(gè)時(shí)刻的隱層狀態(tài)連同當(dāng)前時(shí)刻的網(wǎng)絡(luò)輸入一起作為隱層的輸入,相當(dāng)于狀態(tài)反饋,反饋連接由一組“結(jié)構(gòu)”單元構(gòu)成,用來(lái)記憶前一時(shí)刻的輸出值,局部反饋連接的遞歸神經(jīng)網(wǎng)絡(luò),具有動(dòng)態(tài)映射功能,并使系統(tǒng)具有適應(yīng)時(shí)變特性的能力[5],其隱藏層使用一個(gè)具有與典型微生物生長(zhǎng)曲線(xiàn)相似形狀的Sigmoid函數(shù),這讓神經(jīng)網(wǎng)絡(luò)不需要使用大量節(jié)點(diǎn)就可以獲得相應(yīng)微生物生長(zhǎng)曲線(xiàn)[6],關(guān)聯(lián)層通過(guò)聯(lián)接記憶上一個(gè)時(shí)刻的隱層狀態(tài)連同當(dāng)前時(shí)刻的網(wǎng)絡(luò)輸入一起作為隱層的輸入,相當(dāng)于狀態(tài)反饋,便于做時(shí)間相關(guān)類(lèi)型的預(yù)測(cè)。
由于微生物生長(zhǎng)預(yù)測(cè)是關(guān)于時(shí)間動(dòng)態(tài)化的過(guò)程,ELMAN神經(jīng)網(wǎng)絡(luò)對(duì)歷史狀態(tài)數(shù)據(jù)具有敏感性,增加了網(wǎng)絡(luò)處理動(dòng)態(tài)信息的能力,達(dá)到動(dòng)態(tài)建模的目的,能使預(yù)測(cè)值均勻地分布在實(shí)際值的兩側(cè),適合實(shí)時(shí)系統(tǒng)辨識(shí)的動(dòng)態(tài)遞歸,對(duì)序列問(wèn)題及時(shí)間問(wèn)題有著很好的預(yù)測(cè)效果,因?yàn)橛兄^強(qiáng)的適應(yīng)時(shí)變特性的能力,所以采用此網(wǎng)絡(luò)對(duì)微生物生長(zhǎng)預(yù)測(cè)建模,ELMAN網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)的好壞對(duì)網(wǎng)絡(luò)的性能和預(yù)測(cè)結(jié)果起著重要的影響作用,在網(wǎng)絡(luò)隱含層的節(jié)點(diǎn)選取,以及權(quán)值閾值的取值上,沒(méi)有有效地方法,很容易使得網(wǎng)絡(luò)在建模中,網(wǎng)絡(luò)訓(xùn)練收斂過(guò)慢,導(dǎo)致預(yù)測(cè)效果不佳的表現(xiàn),因此有必要對(duì)ELMAN網(wǎng)絡(luò),特別是針對(duì)實(shí)際問(wèn)題,對(duì)其網(wǎng)絡(luò)結(jié)構(gòu)要特別對(duì)待,本研究對(duì)ELMAN神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)進(jìn)行了改進(jìn),提出一種雙伴承接層的ELMAN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),然后通過(guò)BFA對(duì)其權(quán)值、閾值進(jìn)行優(yōu)化。
由Whiting等[7]提出的基于變量類(lèi)型的分類(lèi)方法將預(yù)測(cè)微生物數(shù)學(xué)模型分為一級(jí)模型、二級(jí)模型和三級(jí)模型,其中二級(jí)模型描述微生物在食品中的生長(zhǎng)情況與環(huán)境條件之間的關(guān)系,也是目前研究的熱點(diǎn),為了使得ELMAN神經(jīng)網(wǎng)絡(luò)來(lái)擬合微生物的生長(zhǎng)狀況,更改了其拓?fù)浣Y(jié)構(gòu),在原有的ELMAN網(wǎng)絡(luò)基礎(chǔ)上加入另一個(gè)承接層,它的輸入變量為細(xì)菌在當(dāng)時(shí)的環(huán)境狀態(tài),輸出為細(xì)菌的瞬時(shí)速率,微生物的初始濃度與生長(zhǎng)速率為ELMAN的輸入,輸出為目標(biāo)濃度,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,傳值函數(shù)見(jiàn)式(1),隱含層閾值函數(shù)見(jiàn)式(2),承接層閾值函數(shù)見(jiàn)式(3):
其中與 y(k)為第 k次輸出集,u為輸入矩陣,g(x)為傳遞函數(shù),w為權(quán)值,x(k)為第k迭代矩陣,f(x)為閾值函數(shù),e(x)為環(huán)境影響函數(shù)。
圖1 改進(jìn)的ELMAN網(wǎng)絡(luò)結(jié)構(gòu)
近年來(lái),越來(lái)越多的仿生優(yōu)化算法出現(xiàn),這些算法是依據(jù)物種在自然進(jìn)化過(guò)程中的存活狀態(tài),這取決于它們的健身狀況和依賴(lài)于他們的覓食或運(yùn)動(dòng)行為,因此,對(duì)任何進(jìn)化物種的覓食行為可適用于任何非線(xiàn)性系統(tǒng)優(yōu)化和建模,細(xì)菌覓食算法就是這類(lèi),它是仿照我們的腸道中的大腸桿菌有一個(gè)覓食策略,由三個(gè)過(guò)程控制,即趨向、繁殖和驅(qū)散[8],優(yōu)化問(wèn)題的解對(duì)應(yīng)搜索空間中細(xì)菌的狀態(tài),即優(yōu)化函數(shù)適應(yīng)值。在趨化過(guò)程中,細(xì)菌運(yùn)動(dòng)模式包括翻轉(zhuǎn)和前進(jìn)。細(xì)菌向任意方向移動(dòng)單位步長(zhǎng)定義為翻轉(zhuǎn)。當(dāng)細(xì)菌完成一次翻轉(zhuǎn)后,若適應(yīng)值得到改善,將沿同一方向繼續(xù)移動(dòng)若干步,直至適應(yīng)值不再改善,或達(dá)到預(yù)定的移動(dòng)步數(shù)臨界值。此過(guò)程定義為前進(jìn)。以趨化過(guò)程中各細(xì)菌適應(yīng)值累加和為標(biāo)準(zhǔn),較差的半數(shù)細(xì)菌死亡,較好的半數(shù)細(xì)菌分裂成兩個(gè)子細(xì)菌。子細(xì)菌將繼承母細(xì)菌生物特性,具有與母細(xì)菌相同的位置及步長(zhǎng)。趨化過(guò)程可確保細(xì)菌的局部搜索能力,復(fù)制過(guò)程能加快細(xì)菌的搜索速度,但對(duì)于復(fù)雜的優(yōu)化問(wèn)題,趨化和復(fù)制無(wú)法避免細(xì)菌陷人局部極小現(xiàn)象發(fā)生,BFA引人驅(qū)散過(guò)程以加強(qiáng)算法全局尋優(yōu)能力[9]。細(xì)菌在完成一定次數(shù)的復(fù)制后,將以一定概率被驅(qū)散到搜索空間中任意位置,避免解陷入局部最優(yōu)的情況發(fā)生。
本研究在優(yōu)化ELMAN權(quán)值問(wèn)題上時(shí)候,有著較多的輸入和隱含層,有125個(gè)參數(shù)ELMAN神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)、層數(shù)、權(quán)重、激活函數(shù)參數(shù)等都是待定或者可調(diào)參數(shù),可通過(guò)一定的算法學(xué)習(xí)得到。通常優(yōu)化的是權(quán)重和激活函數(shù)參數(shù),隨著神經(jīng)網(wǎng)絡(luò)應(yīng)用的越來(lái)越廣泛,在對(duì)自適應(yīng)的得到的權(quán)值與閾值,并不能過(guò)很好地得到預(yù)期的效果。例如GA對(duì)BP網(wǎng)絡(luò)優(yōu)化容易使得,BP網(wǎng)絡(luò)的權(quán)值,閾值容易陷入局部最優(yōu),并不能夠很好適應(yīng)全局。PSO在優(yōu)化問(wèn)題上也被許多研究者所采用,它能做到快速收斂,但是,處理高維度問(wèn)題,容易早熟收斂。正是神經(jīng)網(wǎng)絡(luò)本身的拓?fù)浣Y(jié)構(gòu)的多樣性和權(quán)值閾值的的不確定性,使得沒(méi)有很好地利用在微生物生長(zhǎng)建模上,而B(niǎo)FA在處理高維度的問(wèn)題上具有很好的效率[10],本研究通過(guò)BFA通過(guò)實(shí)際數(shù)據(jù)來(lái)優(yōu)化ELMAN神經(jīng)網(wǎng)絡(luò)的權(quán)值,其模型如圖2所示。
圖2 基于BFA優(yōu)化的ELMAN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
本研究通過(guò)沙氏門(mén)菌的生長(zhǎng)數(shù)據(jù)實(shí)例為研究對(duì)象,數(shù)據(jù)來(lái)源于與ComBase數(shù)據(jù)庫(kù),ComBase數(shù)據(jù)庫(kù)是2003年由英美兩國(guó)將PMP、FM和Growth Predictor進(jìn)行整合而成的數(shù)據(jù)庫(kù)模型,擁有40489個(gè)關(guān)于微生物生長(zhǎng)和存活的數(shù)據(jù)。并且也是世界上最大的預(yù)測(cè)微生物學(xué)信息數(shù)據(jù)庫(kù)。實(shí)驗(yàn)數(shù)據(jù)對(duì)象在溫度20-39℃、pH值在4.4-7.5、AW在0.934-1之間的環(huán)境所得。實(shí)驗(yàn)數(shù)據(jù)共98組,其中測(cè)試數(shù)據(jù)90組,測(cè)試數(shù)據(jù)為8組。
圖3 ELMAN神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果與實(shí)際結(jié)果的對(duì)比
本次實(shí)驗(yàn)通過(guò)MATLAB進(jìn)行建模,通過(guò)90組測(cè)試數(shù)據(jù)對(duì)ELMAN網(wǎng)絡(luò)進(jìn)行訓(xùn)練,在通過(guò)8組測(cè)試組數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行仿真測(cè)試,其經(jīng)過(guò)多次的實(shí)驗(yàn),得到的結(jié)果十分接近于實(shí)際值,并通過(guò)殘差分析顯示異常點(diǎn)僅僅接近2%,統(tǒng)計(jì)實(shí)驗(yàn)結(jié)果可以看出本模型對(duì)微生物生長(zhǎng)的各個(gè)時(shí)期具有良好的預(yù)測(cè)效果,其中某次實(shí)驗(yàn)預(yù)測(cè)結(jié)果與實(shí)際值對(duì)比圖如圖3所示,對(duì)應(yīng)的殘差分析結(jié)果如所圖4所示。
利用其數(shù)據(jù)中的溫度、pH值、AW為伴生承接層輸入層,由模型與實(shí)際值對(duì)比可知,本模型在生長(zhǎng)期到穩(wěn)定期的過(guò)渡期的預(yù)測(cè)有著更高的準(zhǔn)確性,能夠很好根據(jù)實(shí)際情況去預(yù)測(cè)。對(duì)于像是食品檢測(cè)這樣的機(jī)構(gòu)會(huì)有很大程度上的幫助,而且能夠更加有效的使用。其次對(duì)于微生物生長(zhǎng)對(duì)數(shù)期及平穩(wěn)期預(yù)測(cè)比較好,對(duì)于延滯期,如果想預(yù)測(cè)的更加的精確,需要考慮微生物其內(nèi)部的狀態(tài),這使得預(yù)測(cè)更加的復(fù)雜,通常在處理與微生物行為相關(guān)的高水平的變異性和不確定性時(shí)候需要更高的檢測(cè)儀器,由于過(guò)程的復(fù)雜,使得這一數(shù)據(jù)不易檢測(cè)和獲得,使得延滯期的研究進(jìn)展緩慢,有待我們進(jìn)一步去研究。
本研究改進(jìn)了ELMAN網(wǎng)絡(luò)結(jié)構(gòu),并用BFA算法優(yōu)化ELMAN神經(jīng)網(wǎng)絡(luò)中的權(quán)值、閾值,提高了其預(yù)測(cè)精度,利用沙氏門(mén)菌的數(shù)據(jù)為作為網(wǎng)絡(luò)的訓(xùn)練集,試驗(yàn)結(jié)果顯示,該模型可以對(duì)微生物生長(zhǎng)的各個(gè)時(shí)期進(jìn)行有效預(yù)測(cè),并解決經(jīng)驗(yàn)型模型參數(shù)化過(guò)多,以及沒(méi)有生物意義的問(wèn)題。此外本模型能夠預(yù)測(cè)微生物在更多的環(huán)境條件下的生長(zhǎng)和滅活,由不限制影響微生物生長(zhǎng)因子的個(gè)數(shù)可提高本模型的通用性,可使得微生物預(yù)測(cè)模型能有較好的應(yīng)用空間,可以幫助研究人員對(duì)微生物生長(zhǎng)的動(dòng)態(tài)分析,以及在復(fù)雜環(huán)境下對(duì)微生物生長(zhǎng)失活的預(yù)測(cè)。
圖4 ELMAN神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果與實(shí)際結(jié)果的對(duì)比的殘差分析