馮永玖,陳新軍,*,楊曉明,高 峰
(1. 上海海洋大學(xué)海洋科學(xué)學(xué)院,上海 201306; 2. 大洋漁業(yè)資源可持續(xù)開(kāi)發(fā)省部共建教育部重點(diǎn)實(shí)驗(yàn)室,上海 201306 3. 國(guó)家遠(yuǎn)洋漁業(yè)工程技術(shù)研究中心,上海 201306; 4. 遠(yuǎn)洋漁業(yè)協(xié)同創(chuàng)新中心,上海 201306)
棲息地適宜性指數(shù)(HSI)模型最早由美國(guó)科學(xué)家于20世紀(jì)80年代提出,用來(lái)模擬生物體對(duì)周圍棲息環(huán)境要素的反應(yīng)[1]。目前已廣泛應(yīng)用于物種分布與管理等領(lǐng)域[2],并逐漸在海洋漁場(chǎng)的分析與預(yù)測(cè)中得到了應(yīng)用[3-5],如印度洋大眼金槍魚(yú)[6-8]、大西洋及太平洋的魷魚(yú)[9-11]、以及鮐魚(yú)、秋刀魚(yú)等[12]。從研究方法來(lái)看,主要有權(quán)重求和法、幾何平均法[6-7]、分位數(shù)回歸方法[13]和主成分分析法[14]等。HSI的研究不僅是為了從理論上認(rèn)知漁場(chǎng)分布與海洋環(huán)境要素的關(guān)系,也是為了向捕撈生產(chǎn)和漁業(yè)資源管理者提供信息參考。
海洋環(huán)境要素與中心漁場(chǎng)之間存在動(dòng)態(tài)交互關(guān)系并構(gòu)成一個(gè)復(fù)雜的系統(tǒng),環(huán)境要素之間通常存在一定的相關(guān)性。經(jīng)典數(shù)理統(tǒng)計(jì)方法在構(gòu)建HSI模型時(shí),由于無(wú)法消除環(huán)境要素固有的多重相關(guān)性,分析預(yù)報(bào)的精度受到極大的限制。因此,如何建立高精度的漁情預(yù)報(bào)模型,降低預(yù)報(bào)的不確定性,便成為了魚(yú)類HSI建模需要解決的關(guān)鍵科學(xué)問(wèn)題。
從最小化中心漁場(chǎng)預(yù)測(cè)值與實(shí)測(cè)值之間的差異的角度出發(fā),利用人工智能方法進(jìn)行自動(dòng)優(yōu)化,則可望提高漁情預(yù)報(bào)的精度和降低預(yù)報(bào)的不確定性。作為一種著名的組合優(yōu)化算法,遺傳算法(GA)常用于求解復(fù)雜函數(shù)的極值[15]。遺傳算法源自對(duì)達(dá)爾文生物進(jìn)化論的模擬計(jì)算,是一種通過(guò)模擬自然進(jìn)化過(guò)程搜索最優(yōu)解的方法,目前已成為一種成熟的進(jìn)化智能算法[16]。近20年來(lái),遺傳算法在眾多領(lǐng)域得到了廣泛應(yīng)用,例如在復(fù)雜地理系統(tǒng)的建模中遺傳算法被用于建立非線性元胞自動(dòng)機(jī)模型[17],與之類似的組合優(yōu)化算法粒子群優(yōu)化算法和模擬退火算法也得到了較好的應(yīng)用[18-19]。鑒于此,本研究基于遺傳算法構(gòu)建一種能夠獲取和優(yōu)化中心漁場(chǎng)HSI參數(shù)的智能建??蚣蹽eneHSI,并利用模擬數(shù)據(jù)進(jìn)行該框架的執(zhí)行測(cè)試。同時(shí),驗(yàn)證GeneHSI模型框架在一般優(yōu)化策略、不等式、等式和上下界限制條件下對(duì)漁業(yè)模擬數(shù)據(jù)的建模優(yōu)化,并測(cè)試了GeneHSI模型框架對(duì)于不同樣本量數(shù)據(jù)的優(yōu)化解算能力。該基于遺傳算法的GeneHSI框架將有助于實(shí)現(xiàn)漁情預(yù)報(bào)HSI的優(yōu)化建模,并可望引導(dǎo)智能方法在漁業(yè)HSI建模中的應(yīng)用。
遺傳算法(GA)是一種基于生物自然選擇與遺傳機(jī)理的隨機(jī)搜索算法。與傳統(tǒng)搜索算法不同,GA從一組隨機(jī)產(chǎn)生的“種群” (初始可行解)開(kāi)始搜索過(guò)程[15]。待解問(wèn)題的每一個(gè)參數(shù)即是一個(gè)“基因”,一組基因構(gòu)成了問(wèn)題的一個(gè)可行解,解是種群中的個(gè)體,稱為“染色體”。在遺傳算法中,染色體被編碼為一串符號(hào)(二進(jìn)制字符串),這些字符串在在后續(xù)迭代中根據(jù)遺傳規(guī)則不斷進(jìn)化[16]。遺傳算法在適應(yīng)度函數(shù)的引導(dǎo)下進(jìn)行迭代搜索,通過(guò)適應(yīng)度值來(lái)判斷染色體的優(yōu)劣并進(jìn)行優(yōu)勝劣汰;在未達(dá)到算法終止條件時(shí),通過(guò)選擇、交叉和變異3個(gè)算子產(chǎn)生下一代染色體。在形成新一代過(guò)程中,根據(jù)適應(yīng)度值的大小選擇部分后代,淘汰部分較差后代同時(shí)保持種群大小為常數(shù),并繼續(xù)進(jìn)行隨機(jī)搜索和迭代,直到算法收斂從而得到最優(yōu)解(最優(yōu)染色體)[15-16]。
以綜合棲息地基本模型(如連乘模型、算術(shù)平均模型、幾何平均模型、logistic回歸模型等)為基礎(chǔ),以實(shí)際作業(yè)換算的HSI為基準(zhǔn)[20],構(gòu)建GA算法的適應(yīng)度函數(shù)[15]。利用遺傳算法自動(dòng)尋找該適應(yīng)度函數(shù)的最小值,其意義為GA獲取的參數(shù)能夠使模型預(yù)測(cè)值與實(shí)際作業(yè)換算的HSI值之間的差異達(dá)到最小化[16]。對(duì)應(yīng)于最小適應(yīng)度函數(shù)值的染色體,就是一組通過(guò)GA優(yōu)化所得的棲息地指數(shù)模型的參數(shù),而對(duì)應(yīng)的“基因”則為各海洋漁業(yè)環(huán)境要素的權(quán)重。由這樣一組染色體構(gòu)建的HSI模型,即為GA優(yōu)化的漁場(chǎng)預(yù)報(bào)模型。
(1)染色體編碼與種群初始化 染色體即是一組參數(shù)的可行解,采用浮點(diǎn)數(shù)編碼方法,定義染色體的長(zhǎng)度為有效解的變量長(zhǎng)度,定義染色體編碼為a={a0,a1,…,aj,…,am},aj是HSI模型參數(shù),即GA算法中的基因,m表示基因個(gè)數(shù)。
(2)適應(yīng)度函數(shù) 適應(yīng)度函數(shù)是漁場(chǎng)預(yù)報(bào)建模向遺傳算法映射的核心,只有構(gòu)建適應(yīng)度函數(shù)才能夠理解遺傳算法的本質(zhì),也才能夠進(jìn)行遺傳算法的漁情預(yù)報(bào)HSI建模。基于我們前期對(duì)元胞自動(dòng)機(jī)、模擬退火算法和粒子群算法的大量研究[16-19],構(gòu)建了漁情預(yù)報(bào)HSI建模的適應(yīng)度函數(shù)。在遺傳算法中,利用適應(yīng)度函數(shù)F(a)評(píng)價(jià)染色體(可行解)的優(yōu)劣,規(guī)定F(a)的值越小則對(duì)應(yīng)的染色體越優(yōu):
(1)
式中,HSIc表示通過(guò)海洋環(huán)境因素計(jì)算所得的漁場(chǎng)概率,即HSIc=1/[1+exp(-(a0+a1x1+…+amxm))],HSIa表示通過(guò)商業(yè)捕撈數(shù)據(jù)計(jì)算而得的漁場(chǎng)概率,n表示樣本點(diǎn)的數(shù)量。其中,HSIc的表達(dá)式是一種logistic回歸方程式,雖然目前為止這種表達(dá)形式在漁業(yè)棲息地研究中并未發(fā)現(xiàn),但是logistic回歸在野生動(dòng)物的棲息地建模中廣泛使用,一些經(jīng)典論文的引用頻次更是達(dá)到數(shù)百次之多,這表明logistic回歸在動(dòng)物棲息地建模中理論上是成立的[21-22]。
國(guó)際上利用logistic回歸進(jìn)行野生動(dòng)物棲息地建模的經(jīng)典案例很多,包括格雷厄姆山紅松鼠、高溫蚱蜢和布什蟋蟀、高海拔稀有物種以及麂和喜馬拉雅斑羚等[22-25]。海洋魚(yú)類是典型的水生野生動(dòng)物,其棲息地模式與文獻(xiàn)中野生動(dòng)物非常接近,從生態(tài)學(xué)上可以判定logistic回歸符合海洋魚(yú)類。在一項(xiàng)關(guān)于魚(yú)類種群判別的研究中,認(rèn)為logistic回歸比判別分析的效果要好,這直接證明了logistic回歸可以用于漁業(yè)資源與漁場(chǎng)學(xué)領(lǐng)域[26]。在此將logistic回歸方程作為核心構(gòu)建適應(yīng)度函數(shù),但是在GeneHSI建模中并不需要真正執(zhí)行l(wèi)ogistic回歸,只需要借用這種在理論上成立的方程式,通過(guò)遺傳算法自動(dòng)獲取HSI參數(shù)從而完成HSI的建模。
(3)種群的選擇、交叉與變異 確定適當(dāng)?shù)倪x擇算子、交叉算子、變異算子以及算法終止條件,作為GA算法的優(yōu)化策略[15-16]。
(4)最優(yōu)染色體的獲取 最后獲取的最優(yōu)染色體即為需要確定的權(quán)重參數(shù)[15-16],用于建立基于遺傳算法的綜合HSI模型框架GeneHSI。
基于遺傳算法的基本理論以及從漁場(chǎng)預(yù)報(bào)向遺傳算法的映射關(guān)系,構(gòu)建用于漁情預(yù)報(bào)HSI參數(shù)獲取與優(yōu)化的建??蚣蹽eneHSI(圖1)。GeneHSI模型框架通過(guò)Matlab“Optimization Tool”中的GA工具進(jìn)行構(gòu)建。由于該GA工具主要針對(duì)連續(xù)函數(shù),而漁業(yè)HSI的適應(yīng)度函數(shù)卻是一種遍歷所有樣本點(diǎn)的離散函數(shù),因此需要將該離散函數(shù)編寫成為Matlab代碼供GA工具調(diào)用和執(zhí)行[16]。
圖1 遺傳算法用于漁情預(yù)報(bào)HSI參數(shù)獲取與優(yōu)化的建??蚣?/p>
圖1表明GeneHSI由3個(gè)部分組成:(1)待解問(wèn)題構(gòu)建,即HSI模型向遺傳算法空間的映射,通過(guò)海洋環(huán)境因子、商業(yè)捕撈數(shù)據(jù)、以及基于logistic回歸的漁場(chǎng)概率方程構(gòu)建遺傳算法的適應(yīng)度函數(shù);(2)GA初始化,即確定GA產(chǎn)生初始HSI參數(shù)的方案和GA初始種群數(shù)量等;(3)GA優(yōu)化策略,即確定適應(yīng)度函數(shù)優(yōu)化過(guò)程中的迭代方法,包括可行解判斷方法、新解產(chǎn)生的選擇、交叉和變異算子以及算法終止規(guī)則等。其中,選擇概率Ps一般通過(guò)比例選擇和保存策略等方法自動(dòng)確定,交叉概率Pc一般選取0.4—0.99之間的值,而變異概率Pm一般選取0.0001—0.1之間的值[15]。模型終止準(zhǔn)則包括以下幾個(gè)方面[15-16]:1)GeneHSI最大計(jì)算時(shí)間(與計(jì)算機(jī)硬件關(guān)系較大),超出設(shè)定的時(shí)間則模型終止;2)最大迭代次數(shù),達(dá)到該迭代次數(shù)則模型終止;3)適應(yīng)度函數(shù)極限值,當(dāng)達(dá)到極限值則模型終止;4)兩次計(jì)算所得的適應(yīng)度函數(shù)值的差值(計(jì)算精度),當(dāng)該差值小于某閾值則模型終止。
為驗(yàn)證該GeneHSI模型框架的正確性和有效性,更進(jìn)一步探測(cè)其使用和控制方法,使用模擬數(shù)據(jù)進(jìn)行測(cè)試。在模擬數(shù)據(jù)中,假設(shè)與漁場(chǎng)概率相關(guān)的海洋環(huán)境因素有溫度、鹽度、葉綠素、溶解氧、溫差以及海面高度距平均值等。由于各種海洋環(huán)境因素的值域范圍不一致,為了能夠在同一個(gè)方程式中進(jìn)行換算,將其進(jìn)行歸一化處理,所有環(huán)境因子的值域范圍歸一化到[0, 1]之間。在實(shí)際操作中,利用EXCEL的隨機(jī)數(shù)發(fā)生器RAND()產(chǎn)生模擬數(shù)據(jù),RAND()隨機(jī)產(chǎn)生的數(shù)值均在[0—1]之間(表1)。根據(jù)研究要求,分別產(chǎn)生了50、100、1000、5000和10000等5種樣本數(shù)據(jù),用于檢驗(yàn)GeneHSI模型的有效性以及模型對(duì)樣本量的響應(yīng)。
表1 歸一化海洋環(huán)境因子與漁場(chǎng)概率的模擬數(shù)據(jù)
在GeneHSI模型執(zhí)行之前,首先必須確定模型的優(yōu)化策略,即確定遺傳算子與終止準(zhǔn)則。本文使用輪盤賭法自動(dòng)確定選擇概率Ps,選取交叉概率Pc為0.6,而變異概率Pm為0.1。由于模型計(jì)算時(shí)間與適應(yīng)度極值的影響較小,本研究設(shè)置模型終止準(zhǔn)則為最大迭代次數(shù)500次和最優(yōu)適應(yīng)度函數(shù)差值(計(jì)算精度)為1e-6,達(dá)到其中任何一個(gè)條件則模型終止。在GeneHSI模型實(shí)際執(zhí)行中,均由于計(jì)算精度達(dá)到1e-6而終止模型運(yùn)行。根據(jù)GeneHSI模型以及模型優(yōu)化策略,首先利用50個(gè)模擬數(shù)據(jù)樣本點(diǎn)建立了適應(yīng)度函數(shù),從而獲取HSI的參數(shù)。遺傳算法在獲取HSI參數(shù)的過(guò)程中,受到適應(yīng)度函數(shù)的引導(dǎo)并進(jìn)行優(yōu)化,隨著優(yōu)化的推進(jìn)適應(yīng)度函數(shù)值不斷降低,最終達(dá)到最小值(圖2)。該最小值即為在最終獲取的HSI參數(shù)下,預(yù)測(cè)漁場(chǎng)概率與真實(shí)漁場(chǎng)概率之間差異的最小值。
遺傳算法對(duì)HSI參數(shù)進(jìn)行計(jì)算與優(yōu)化的適應(yīng)度收斂過(guò)程。最佳適應(yīng)度值收斂到0.250918,平均適應(yīng)度值收斂到0.27452,根據(jù)適應(yīng)度函數(shù)的構(gòu)造理論,適應(yīng)度值越小表明HSI參數(shù)導(dǎo)致的預(yù)測(cè)預(yù)報(bào)誤差越小。最佳適應(yīng)度值和平均適應(yīng)度值均隨迭代而減小,最佳適應(yīng)度值在第16次迭代時(shí)收斂,但平均適應(yīng)度值上下波動(dòng),未呈現(xiàn)收斂趨勢(shì)(圖2)。直到迭代結(jié)束,最佳、最差(Worst)與平均適應(yīng)度值之間的差異仍較大,表明GeneHSI在沒(méi)有限制參數(shù)的條件下收斂性較差,結(jié)果并不理想(圖2)。因此,獲取的HSI參數(shù)與真實(shí)情況存在一定的差異(表2)。
表2 一般優(yōu)化策略下遺傳算法獲取的HSI參數(shù)
2.3.1 不等式限制條件
由于一般優(yōu)化策略下獲取的HSI參數(shù)并不理想,因此需對(duì)HSI的參數(shù)范圍進(jìn)行限制,使GeneHSI在有限的范圍內(nèi)進(jìn)行搜索,確保結(jié)果更加準(zhǔn)確。遺傳算法中,不等式、等式和參數(shù)范圍限制條件較常用,其中不等式和等式限制條件指的是多種海洋環(huán)境因子(溫度、鹽度、葉綠素、溶解氧、溫差以及海面高度距平均值)符合的某種關(guān)系,而參數(shù)范圍限制條件指的是HSI參數(shù)上下界范圍。一般地,不等式條件可以表達(dá)為:
圖2 一般優(yōu)化策略下利用遺傳算法獲取與優(yōu)化HSI參數(shù)的收斂過(guò)程
A×x≤b
(2)
式中,A和b是待定的限制條件,若A為矩陣,則b為向量;若A為向量,則b為數(shù)值;x是海洋環(huán)境因子向量。在GeneHSI優(yōu)化執(zhí)行中,x是既定的樣本數(shù)據(jù),A和b的設(shè)置需經(jīng)過(guò)理論探討和經(jīng)驗(yàn)分析加以確定,可以源于傳統(tǒng)方法的計(jì)算結(jié)果、也可以源于對(duì)研究對(duì)象和研究區(qū)域的認(rèn)知。
為了探測(cè)不等式限制條件對(duì)GeneHSI結(jié)果的影響,設(shè)A=[1 1 1 1 1 1 1]、b=5進(jìn)行GeneHSI模型執(zhí)行,優(yōu)化過(guò)程和HSI參數(shù)結(jié)果分別如圖3和表3。
圖3表明,在不等式條件下最佳適應(yīng)度值收斂到0.256759,平均適應(yīng)度值收斂到0.264893。在迭代30次之后,平均與最佳適應(yīng)度的收斂曲線較為接近,呈現(xiàn)較為明顯的收斂狀態(tài)(圖3)。當(dāng)適應(yīng)度函數(shù)曲線開(kāi)始收斂,最佳與平均適應(yīng)度值開(kāi)始接近,而最差適與平均適應(yīng)度值之間的差異仍較大(圖3)。
表3 不等式限制條件下遺傳算法獲取的HSI參數(shù)
2.3.2 等式限制條件
與不等式限制條件類似,等式限制條件可以表達(dá)為:
Aeq×x=beq
(3)
式中,Aeq和beq是待定的限制條件,若Aeq為矩陣,則beq為向量;若Aeq為向量,則beq為數(shù)值;x是海洋環(huán)境因子向量。與不等式條件類似,x是既定的樣本數(shù)據(jù),Aeq和beq通過(guò)理論和經(jīng)驗(yàn)分析加以確定。
威爾士英語(yǔ)指在威爾士地區(qū)的口音和方言。威爾士語(yǔ)對(duì)這里的英語(yǔ)影響很深。而且,威爾士語(yǔ)也是現(xiàn)代社會(huì)中使用最廣泛的蓋爾特語(yǔ)言了。
圖3 不等式限制條件下利用遺傳算法獲取與優(yōu)化HSI參數(shù)的收斂過(guò)程
為探測(cè)等式限制條件對(duì)GeneHSI結(jié)果的影響,設(shè)置Aeq=[0 1 1 1 1 1 1]、beq=3.5進(jìn)行優(yōu)化。根據(jù)上述等式限制條件進(jìn)行GeneHSI模型執(zhí)行,其優(yōu)化過(guò)程和HSI參數(shù)結(jié)果分別如圖4和表4。
等式限制條件下,最佳適應(yīng)度值收斂到0.284878,平均適應(yīng)度值收斂到0.284905。在迭代25次之后,平均與最佳適應(yīng)度值完全重合,說(shuō)明適應(yīng)度函數(shù)曲線完全收斂,且效果較好。隨著適應(yīng)度函數(shù)開(kāi)始收斂,最佳、最差和平均適應(yīng)度值完全一致,表明GeneHSI優(yōu)化效果非常理想(圖4)。
2.3.3 上下界限制
除了不等式和等式限制條件,在GeneHSI算法中也常用到上下界限制限制條件。研究表明,傳統(tǒng)HSI建模中獲取的HSI參數(shù)值域均為0到1之間[10-13],因此在GeneHS優(yōu)化控制中可利用這個(gè)關(guān)鍵的信息對(duì)適應(yīng)度函數(shù)進(jìn)行引導(dǎo)。為此,設(shè)置HSI參數(shù)的上界為 [1 1 1 1 1 1 1],而下界為[0 0 0 0 0 0 0],優(yōu)化過(guò)程如圖5。
從圖5可知,上下界限制條件下GeneHSI在迭代到34次時(shí)開(kāi)始收斂,最佳適應(yīng)度值收斂到0.252479,平均適應(yīng)度值收斂到0.253145,收斂后最佳與平均適應(yīng)度曲線重合較好。隨著優(yōu)化進(jìn)程最差和最佳適應(yīng)度值之間的范圍不斷縮小,開(kāi)始收斂到最優(yōu)適應(yīng)度值,但是優(yōu)化中最差適應(yīng)度值仍有局部反彈跡象(圖5)。總體評(píng)估來(lái)看,GeneHSI優(yōu)化的效果相對(duì)較好,最終獲取的HSI參數(shù)如表5。
2.3.4 綜合限制條件
為達(dá)到GeneHSI模型的最佳優(yōu)化效果,通常同時(shí)使用不等式、等式和上下界3種限制條件,形成綜合限制條件。圖6顯示了3種限制條件同時(shí)使用的適應(yīng)度函數(shù)優(yōu)化過(guò)程,具體限制條件與前述設(shè)置保持一致。
表4 等式限制條件下遺傳算法獲取的HSI參數(shù)
圖4 等式限制條件下利用遺傳算法獲取與優(yōu)化HSI參數(shù)的收斂過(guò)程
圖5 上下界限制條件下利用遺傳算法獲取與優(yōu)化HSI參數(shù)的收斂過(guò)程
表5上下界限制條件下遺傳算法獲取的HSI參數(shù)
Table5HSIparametersretrievedusinggeneticalgorithmunderparameters′bounds
常數(shù)項(xiàng)Constant海表溫度SST鹽度SS葉綠素CHA溶解氧DO溫差TD海面高度距平均值SSHA0.73560.81660.24550.98380.72690.99950.5973
圖6 綜合限制條件下利用遺傳算法獲取與優(yōu)化HSI參數(shù)的收斂過(guò)程
表6綜合限制條件下遺傳算法獲取的HSI參數(shù)
Table6HSIparametersretrievedusinggeneticalgorithmundercomprehensiveconstraints
常數(shù)項(xiàng)Constant海表溫度SST鹽度SS葉綠素CHA溶解氧DO溫差TD海面高度距平均值SSHA0.50770.70740.27090.55000.56680.61240.1986
綜合限制條件下GeneHSI模型在迭代到27次時(shí)開(kāi)始收斂,最佳適應(yīng)度值收斂到0.380855,平均適應(yīng)度值收斂到0.380919,收斂曲線表明優(yōu)化效果非常理想。隨著優(yōu)化進(jìn)程最差和最佳適應(yīng)度值之間的范圍收縮較快且非常徹底,收斂后曲線未發(fā)現(xiàn)任何波動(dòng)(圖6),說(shuō)明綜合限制條件下GeneHSI取得了較佳的優(yōu)化效果,獲取的HSI參數(shù)如表6。
除了各種限制條件,樣本量對(duì)GeneHSI建模同樣具有重要的影響。在漁場(chǎng)預(yù)報(bào)分析中,樣本是通過(guò)商業(yè)捕撈而產(chǎn)生的,因此對(duì)于研究區(qū)的特定魚(yú)種,樣本量并不是研究者主觀決定的。但是對(duì)于一種智能建模框架而言,應(yīng)該具有處理大樣本的能力。因此,本文進(jìn)一步分析GeneHSI模型對(duì)于各種樣本量的處理能力,并分析優(yōu)化過(guò)程與優(yōu)化結(jié)果對(duì)于不同樣本量的響應(yīng)。為此,產(chǎn)生了100、1000、5000和10000四種樣本量,樣本產(chǎn)生的方法如3.1節(jié)所述。選擇在綜合限制條件下進(jìn)行GeneHSI模型執(zhí)行,具體限制參數(shù)和前述設(shè)置一致,最終模型優(yōu)化過(guò)程如圖7。
圖7 不同樣本量下利用遺傳算法獲取與優(yōu)化HSI參數(shù)的收斂過(guò)程
圖7表明各種樣本量在GeneHSI模型中均得到了優(yōu)化處理,其中100樣本量收斂于第21次迭代,最佳適應(yīng)度值0.283916,平均適應(yīng)度值0.283916;1000樣本量收斂于第16次迭代,最佳適應(yīng)度值0.288048,平均適應(yīng)度值0.300328;5000樣本量收斂于第13次迭代,最佳適應(yīng)度值0.310632,平均適應(yīng)度值0.311132;10000樣本量收斂于第11次迭代,最佳適應(yīng)度值0.308201,平均適應(yīng)度值0.309327。模型優(yōu)化過(guò)程與收斂曲線顯示,10000樣本量收斂最快,收斂效果最好;1000和5000樣本量收斂效果次之;而100樣本量收斂的效果較晚,完全收斂出現(xiàn)在第30次迭代。4種樣本量在收斂之后,最差與平均適應(yīng)度值之間存在局部的波動(dòng),其中大樣本量10000的波動(dòng)最為嚴(yán)重,而小樣本量100的波動(dòng)最小。優(yōu)化結(jié)果表明,GeneHSI模型具有處理各種樣本量的能力,同時(shí)對(duì)于樣本量的響應(yīng)也不盡一致,各種樣本量下GeneHSI獲取的參數(shù)如表7所示。
遺傳算法用于漁場(chǎng)漁情預(yù)報(bào),其核心思想在于可以使計(jì)算漁場(chǎng)概率值與真實(shí)漁場(chǎng)概率值的累計(jì)誤差達(dá)到最小化。研究表明,遺傳算法本質(zhì)上是一種具有智能特性的隨機(jī)優(yōu)化算法[15],能夠行之有效地效優(yōu)化魚(yú)類HSI的建模并獲取HSI參數(shù)。由于遺傳算法的隨機(jī)特性[15],在對(duì)它進(jìn)行控制并引導(dǎo)算法有效執(zhí)行的過(guò)程中,對(duì)建模者有較高的技術(shù)要求(如對(duì)Matlab工具的熟練程度和Matlab代碼編寫的能力),需要研究者對(duì)研究區(qū)域與研究對(duì)象有較高的熟悉程度[16-17]。本研究所采用的數(shù)據(jù)是隨機(jī)產(chǎn)生的模擬數(shù)據(jù),模擬數(shù)據(jù)的作用和關(guān)鍵在于:(1)模擬數(shù)據(jù)比之真實(shí)數(shù)據(jù),其數(shù)據(jù)中存在的規(guī)律性要差,因此如果GeneHSI能在該模擬數(shù)據(jù)上得到很好的應(yīng)用,那么證明GeneHSI模型具有很強(qiáng)的普適性,當(dāng)應(yīng)用于規(guī)律性更強(qiáng)的漁業(yè)真實(shí)數(shù)據(jù)時(shí)可望得到更好的結(jié)果;(2)遺傳需要較強(qiáng)的人工干預(yù)與良好的參數(shù)控制經(jīng)驗(yàn)[16-17],模擬數(shù)據(jù)有利于從多角度探討GeneHSI算法的控制與使用方法。這些使用控制方法為真實(shí)漁業(yè)數(shù)據(jù)的建模應(yīng)用奠定了技術(shù)基礎(chǔ)。
表7 不同樣本量下遺傳算法獲取的HSI參數(shù)
與一般優(yōu)化策略下的GeneHSI比較,不等式條件下最佳適應(yīng)度值要大、而平均適應(yīng)度值要低,表明整體優(yōu)化結(jié)果稍好。但是不等式條件下的GeneHSI優(yōu)化效果并未達(dá)到最佳狀態(tài),表明在不等式條件下雖然效果優(yōu)于一般優(yōu)化策略,因此仍需對(duì)算法進(jìn)行深入的優(yōu)化控制。與一般優(yōu)化策略和不等式優(yōu)化策略比較,等式限制條件下GeneHSI參數(shù)的獲取效果更好,優(yōu)化曲線收斂更加徹底。
與一般優(yōu)化策略和不等式優(yōu)化策略比較,上下界限制條件下GeneHSI模型取得了更好的收斂效果;但比之等式條件,上下界條件下優(yōu)化曲線的收斂情況卻較差,表現(xiàn)為收斂較晚且最佳適應(yīng)度曲線與平均適應(yīng)度曲線重合性較差,但是卻獲得了更小的最佳和平均適應(yīng)度值。綜合限制條件與幾種單項(xiàng)優(yōu)化限制條件比較,GeneHSI模型取得了更好的收斂效果,適應(yīng)度函數(shù)的收斂更早、且最佳與平均適應(yīng)度值重合得非常一致。
總體來(lái)看,在不同的限制條件下,遺傳算法獲取的HSI具有較大的差異,其中一般優(yōu)化策略下獲取的HSI參數(shù)最差,加以限制的不等式、等式和上下界條件下其優(yōu)化過(guò)程顯著地更加合理,因此獲取的HSI參數(shù)也更準(zhǔn)確。理論上,適應(yīng)度函數(shù)值是漁場(chǎng)概率計(jì)算值與真實(shí)值的累計(jì)誤差[15-17],但是函數(shù)優(yōu)化收斂過(guò)程較好時(shí),最終對(duì)應(yīng)的適應(yīng)度值并不是所有限制條件下可能得到的最低值。因此,評(píng)價(jià)HSI參數(shù)結(jié)果是否合理和準(zhǔn)確,并不是以適應(yīng)度值的高低為唯一標(biāo)準(zhǔn)的[18-19];應(yīng)當(dāng)同時(shí)考慮到適應(yīng)度函數(shù)的優(yōu)化收斂過(guò)程,并結(jié)合對(duì)研究區(qū)漁場(chǎng)的專業(yè)知識(shí)進(jìn)行判斷。綜合來(lái)看,對(duì)GeneHSI的優(yōu)化過(guò)程加以限制,尤其是上下界等限制條件的使用將使HSI參數(shù)優(yōu)化結(jié)果更加合理[8-10]。
針對(duì)于漁場(chǎng)預(yù)報(bào)HSI建模,增加樣本量并不會(huì)顯著增加遺傳算法需要迭代的次數(shù),也不會(huì)增加遺傳算法的實(shí)際解算時(shí)間。這與地理復(fù)雜系統(tǒng)中的建模有所不同,后者會(huì)顯著增加遺傳算法的迭代次數(shù)和解算時(shí)間[18-19]。這可能由兩個(gè)原因造成的:本文使用的海洋環(huán)境因子相對(duì)較少,或漁業(yè)HSI建模與經(jīng)典地理系統(tǒng)建模比較數(shù)據(jù)復(fù)雜程度稍低,因此遺傳算法解算起來(lái)效率更高。
在對(duì)GeneHSI有效控制的前提下,大樣本量反而有可能使遺傳算法更早地收斂于合理的適應(yīng)度值[15]。研究表明,大樣本量得到的適應(yīng)度值一般會(huì)大于小樣本量得到的適應(yīng)度值[16-17]。但是這種情況并不是絕對(duì)的,當(dāng)用于建模的數(shù)據(jù)規(guī)律性較強(qiáng)時(shí),大樣本量反而能夠得到更小的適應(yīng)度值[15]。在真實(shí)漁情預(yù)報(bào)中,受到商業(yè)捕撈數(shù)據(jù)的限制,一般很少能夠獲取到大樣本量數(shù)據(jù)[6-11],這進(jìn)一步表明了GeneHSI能夠高效地對(duì)漁場(chǎng)預(yù)報(bào)進(jìn)行優(yōu)化處理。
傳統(tǒng)HSI模型在漁業(yè)科學(xué)中應(yīng)用廣泛,主要用于棲息地質(zhì)量評(píng)估、資源量估算、分析選擇漁場(chǎng)和漁情預(yù)報(bào)等,但各自有不同的特點(diǎn)。針對(duì)不同目的和研究區(qū),各種模型的適用性和效果則不同。與傳統(tǒng)HSI模型比較,GeneHSI模型存在諸多不同之處(表8)。
表8 GeneHSI模型與傳統(tǒng)HSI模型的比較
關(guān)于連乘法、最小/最大值法、算術(shù)/幾何平均法和分位數(shù)回歸法的“模型特點(diǎn)”參見(jiàn)文獻(xiàn)[27]
研究表明,經(jīng)典的相關(guān)和回歸分析方法并不適合于生態(tài)學(xué)領(lǐng)域的相關(guān)因素關(guān)系研究[27]。因此,漁業(yè)HSI建模一般地先采用單因子構(gòu)建SI函數(shù),再通過(guò)幾何平均法[6-7]、分位數(shù)回歸方法[13]和主成分分析法[14]等計(jì)算HSI值。與表8中的連乘法等6種模型不同,GeneHSI模型通過(guò)適應(yīng)度函數(shù)直接搜索、優(yōu)化并獲取海洋環(huán)境因素的權(quán)重,進(jìn)而直接計(jì)算得到HSI值。傳統(tǒng)漁業(yè)HSI的應(yīng)用研究實(shí)際上將各種不同類型的因素進(jìn)行等值賦權(quán),雖然這些方法都是經(jīng)過(guò)漁業(yè)專家知識(shí)而獲得的,但顯然帶有主觀判斷的成分[27]。在等值賦權(quán)中,海洋環(huán)境因子的相關(guān)性通常被忽略,而這種相關(guān)性將對(duì)HSI的建模具有負(fù)面的影響。GeneHSI模型同時(shí)考慮海表溫度、鹽度、葉綠素、溶解氧、溫差和海面高度距平均值等不同類型的海洋環(huán)境因素,在遺傳優(yōu)化中自動(dòng)消除這些因素相關(guān)性的負(fù)面影響。這表明,GeneHSI模型是一個(gè)典型的多變量HSI模型,且HSI參數(shù)的含義就是海洋環(huán)境因素的權(quán)重,而傳統(tǒng)HSI模型是對(duì)SI曲線的一種擬合,其參數(shù)不具備物理意義。
比較而言,傳統(tǒng)HSI模型的復(fù)雜性較低,因此其建模難度和智能化程度較低[6-7, 27];而GeneHSI模型復(fù)雜性和建模難度均較高,但其具有高度的智能化程度。GeneHSI模型估計(jì)結(jié)果的保守或樂(lè)觀程度決定于GA限制參數(shù),在應(yīng)用方面較適合于棲息地質(zhì)量評(píng)估、漁場(chǎng)分析和漁情預(yù)報(bào)等。
基于廣泛應(yīng)用于各領(lǐng)域的遺傳算法,本文提出了一種漁情預(yù)報(bào)HSI參數(shù)獲取與智能優(yōu)化的方法框架GeneHSI,并對(duì)該模型框架的使用和參數(shù)控制進(jìn)行了分析與討論。本研究的目的在于提供一種基于遺傳算法的漁業(yè)HSI建模框架和行之有效的智能建模方法與思路,因此側(cè)重于模型建立的整體框架、模型建立的思路以及模型執(zhí)行過(guò)程中的人為控制。
基于遺傳算法的HSI建模有助于發(fā)展現(xiàn)有的漁情預(yù)報(bào)的理論和方法。但在以后的研究中,應(yīng)將該GeneHSI模型框架應(yīng)用到實(shí)際的漁情預(yù)報(bào)分析中,同時(shí)通過(guò)實(shí)際的應(yīng)用與反饋來(lái)優(yōu)化GeneHSI模型。
:
[1]U. S. Fish and Wildlife Service. Habitat Evaluation Procedures (HEP). Washington: U. S. Fish and Wildlife Service, 1980.
[2]U. S. Fish and Wildlife Service. Standards for the development of habitat suitability index models[R]. U. S. Fish and Wildlife Service, 1981: 1-81.
[3]Store R, Jokim?ki J. A GIS-based multi-scale approach to habitat suitability modeling. Ecological Modelling, 2003, 169(1): 1-15.
[4]Jin L R, Sun K P, He H S, Zhou Y F. Research advances in habitat suitability index model. Chinese Journal of Ecology, 2008, 27(5): 841-846.
[5]Zielinski W J, Dunk J R, Yaeger J S, LaPlante D W. Developing and testing a landscape-scale habitat suitability model for fisher (Martespennanti) in forests of interior northern California. Forest Ecology and Management, 2010, 260(9): 1579-1591.
[6]Fan W, Cui X S, Shen X Q. Progress in fishing-ground analysis and fishing condition forecasting. Journal of Fisheries of China, 2005, 29(5): 706-710.
[7]Chen X J, Feng B, Xu L X. A comparative study on habitat suitability index of bigeye tuna,Thunnusobesusin the Indian Ocean. Journal of Fishery Sciences of China, 2008, 15(2): 269-278.
[8]Fan J T, Chen X J, Qian W G, Liu B L. Distribution of fishing ground ofThunnusAlalunnusand its relationship with sea suderace temperature in the waters around Vanuatu. Transactions of Oceanology and Limnology, 2011, (1): 71-78.
[9]Song L M, Zhou Y G. Developing an integrated habitat index for bigeye tuna (Thunnusobesus) in the Indian Ocean based on longline fisheries data. Fisheries Research, 2010, 105(2): 63-74.
[10]Chen F, Chen X J, Liu B L, Qian W G, Tian S Q. Relationship between fishing ground ofOmmastrephesbartramiiand vertical temperature structure in the northwestern Pacific Ocean. Journal of Shanghai Ocean University, 2010, 19(4): 495-504.
[11]Chen X, Tian S, Chen Y, Liu B. A modeling approach to identify optimal habitat and suitable fishing grounds for neon flying squid (Ommastrephesbartramii) in the Northwest Pacific Ocean. Fishery Bulletin, 2010, 108(1): 1-14.
[12]Tian S Q, Chen X J, Chen Y, Xu L X, Dai X J. Evaluating habitat suitability indices derived from CPUE and fishing effort data forOmmatrephesbratramiiin the northwestern Pacific Ocean. Fisheries Research, 2009, 95(2/3): 181-188.
[13]Li G, Chen X J, Guan W J. Stock assessment and risk analysis of management strategies forScomberjaponicusin the East China Sea and Yellow Sea using a Bayesian approach. Journal of Fisheries of China, 2010, 34(5): 740-750.
[14]Feng B, Tian S, Chen X J. The habitat suitability index ofIllexargentinusby using quartile regression method in the Southwest Atlantic. Transactions of Oceanology and Limnology, 2010, (1): 15-22.
[15]Hu Z M, Chen X J, Zhou Y Q, Qian W G, Liu B L. Forecasting fishing ground ofDosidicusgigasbased on habitat suitability index off Peru. Acta Oceanologica Sinica, 2010, 32(5): 67-75.
[16]Xuan G N, Cheng R W. Genetic Algorithm and the Engineering Optimization. Yu X J, Zhou G G, translate. Beijing: Press of Tsinghua University, 2004.
[17]Feng Y J, Liu Y, Han Z. Land use simulation and landscape assessment by using genetic algorithm based on cellular automata under different sampling schemes. Chinese Journal of Applied Ecology, 2011, 22(4): 957-963.
[18]Feng Y, Liu Y. An optimised cellular automata model based on adaptive genetic algorithm for urban growth simulation // Yeh A, Shi J W, Leung Y, Zhou C, eds. Advances in Spatial Data Handling and GIS, Lecture Notes in Geoinformation and Cartography. Berlin, Heidelberg: Springer-Verlag, 2012: 27-38.
[19]Feng Y J, Liu Y. A heuristic cellular automata approach for modelling urban land-use change based on simulated annealing. International Journal of Geographical Information Science, 2013, 27(3): 449-466.
[20]Feng Y J, Liu Y, Tong X H, Liu M L, Deng S S. Modeling dynamic urban growth using cellular automata and particle swarm optimization rules. Landscape and Urban Planning, 2011, 102(3): 188-196.
[21]Tian S Q, Chen X J. Impacts of different calculating methods for nominal CPUE on CPUE standardization. Journal of Shanghai Ocean University, 2010, 19(2): 240-245.
[22]Keating K A, Cherry S. Use and interpretation of logistic regression in habitat-selection studies. Journal of Wildlife Management, 2004, 68(4): 774-789.
[23]Pereira J M C, Itami R M. GIS-based habitat modeling using logistic multiple regression: A study of the Mt. Graham Red Squirrel. Photogrammetric Engineering and Remote Sensing, 1991, 57(11): 1475-1486.
[24]Hein S, Voss J, Poethke H J, Boris S. Habitat suitability models for the conservation of thermophilic grasshoppers and bush crickets-simple or complex? Journal of Insect Conservation, 2007, 11(3): 221-240.
[25]Singh N J, Yoccoz N G, Bhatnagar Y V, Fox J L. Using habitat suitability models to sample rare species in high-altitude ecosystems: a case study with Tibetan argali. Biodiversity and Conservation, 2009, 18(11): 2893-2908.
[26]Singh A, Kushwaha S P S. Refining logistic regression models for wildlife habitat suitability modeling: A case study with muntjak and goral in the Central Himalayas, India. Ecological Modelling, 2011, 222(8): 1354-1366.
[27]Prager M H, Fabrizio M C. Comparison of logistic regression and discriminant analyses for stock identification of anadromous fish, with application to striped bass (Moronesaxatilis) and American shad (Alosasapidissima). Canadian Journal of Fisheries and Aquatic Sciences, 1990, 47(8): 1570-1577.
[28]Gong C, Chen X J, Gao F, Guan W J, Lei L. Review on habitat suitability index in fishery science. Journal of Shanghai Ocean University, 2011, 20(2): 260-269.
參考文獻(xiàn):
[3]金龍如, 孫克萍, 賀紅士, 周宇飛. 生境適宜度指數(shù)模型研究進(jìn)展. 生態(tài)學(xué)雜志, 2008, 27(5): 841-846.
[5]樊偉, 崔雪森, 沈新強(qiáng). 漁場(chǎng)漁情分析預(yù)報(bào)的研究及其進(jìn)展. 水產(chǎn)學(xué)報(bào), 2005, 29(5): 706-710.
[6]陳新軍, 馮波, 許柳雄. 印度洋大眼金槍魚(yú)棲息地指數(shù)研究及其比較. 中國(guó)水產(chǎn)科學(xué), 2008, 15(2): 269-278.
[7]范江濤, 陳新軍, 錢衛(wèi)國(guó), 劉必林. 瓦努阿圖周邊海域長(zhǎng)鰭金槍魚(yú)漁場(chǎng)分布及其與表溫關(guān)系. 海洋湖沼通報(bào), 2011, (1): 71-78.
[9]陳峰, 陳新軍, 劉必林, 錢衛(wèi)國(guó), 田思泉. 西北太平洋柔魚(yú)漁場(chǎng)與水溫垂直結(jié)構(gòu)關(guān)系. 上海海洋大學(xué)學(xué)報(bào), 2010, 19(4): 495-504.
[12]李綱, 陳新軍, 官文江. 基于貝葉斯方法的東、黃海鮐資源評(píng)估及管理策略風(fēng)險(xiǎn)分析. 水產(chǎn)學(xué)報(bào), 2010, 34(5): 740-750.
[13]馮波, 田思泉, 陳新軍. 基于分位數(shù)回歸的西南太平洋阿根廷滑柔魚(yú)棲息地模型研究. 海洋湖沼通報(bào), 2010, (1): 15-22.
[14]胡振明, 陳新軍, 周應(yīng)祺, 錢衛(wèi)國(guó), 劉必林. 利用棲息地適宜指數(shù)分析秘魯外海莖柔魚(yú)漁場(chǎng)分布. 海洋學(xué)報(bào), 2010, 32(5): 67-75.
[15]玄光男, 程潤(rùn)偉. 遺傳算法與工程優(yōu)化. 于歆杰, 周根貴, 譯. 北京: 清華大學(xué)出版社, 2004.
[16]馮永玖, 劉艷, 韓震. 不同樣本方案下遺傳元胞自動(dòng)機(jī)的土地利用模擬及景觀評(píng)價(jià). 應(yīng)用生態(tài)學(xué)報(bào), 2011, 22(4): 957-963.
[20]田思泉, 陳新軍. 不同名義CPUE計(jì)算法對(duì)CPUE標(biāo)準(zhǔn)化的影響. 上海海洋大學(xué)學(xué)報(bào), 2010, 19(2): 240-245.
[27]龔彩霞, 陳新軍, 高峰, 官文江, 雷林. 棲息地適宜性指數(shù)在漁業(yè)科學(xué)中的應(yīng)用進(jìn)展. 上海海洋大學(xué)學(xué)報(bào), 2011, 20(2): 260-269.