国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于空間自回歸和空間聚類的漁情預(yù)報(bào)模型

2015-04-11 03:26袁紅春譚明星顧怡婷陳新軍
海洋科學(xué) 2015年12期
關(guān)鍵詞:金槍魚棲息地聚類

袁紅春, 譚明星, 顧怡婷, 陳新軍

(上海海洋大學(xué): 1.信息學(xué)院; 2.海洋科學(xué)學(xué)院, 上海 201306)

傳統(tǒng)的遠(yuǎn)洋漁情預(yù)報(bào)中, 多數(shù)學(xué)者采用多元線性回歸方法定量地對(duì)環(huán)境數(shù)據(jù)及漁獲數(shù)據(jù)進(jìn)行分析,獲得預(yù)報(bào)模型。如沈金鰲等[1]通過多元線性回歸分析,將帶魚的資源量指數(shù)、各汛期的總捕撈努力量及長(zhǎng)江徑流量作為預(yù)報(bào)因子建立模型, 預(yù)報(bào)嵊山冬季帶魚(Trichiurus lepturus)魚汛期的漁獲量。陳新軍等[2]在分析東黃海鮐(Scomber japonicus)的漁場(chǎng)時(shí), 采用廣義線性模型(Generalized Linear Model, GLM)和廣義可加模型(Generalized Additive Model, GAM), 結(jié)合海洋環(huán)境因子建立預(yù)報(bào)模型, 以分析漁場(chǎng)資源的形成機(jī)制。陳新軍等[3-4]研究了西北太平洋柔魚(Ommastrephes batrami)漁場(chǎng)與環(huán)境因子的內(nèi)在關(guān)系,利用月相對(duì)光誘魷釣作業(yè)的影響, 證明月相對(duì)日產(chǎn)量的影響顯著。但由于環(huán)境數(shù)據(jù)和漁獲數(shù)據(jù)之間的關(guān)系并非線性的, 傳統(tǒng)的線性回歸預(yù)報(bào)模型不能準(zhǔn)確地預(yù)測(cè)漁情信息。隨著人工智能的崛起, 近年來(lái)有學(xué)者將人工智能技術(shù)用于漁情預(yù)測(cè)。杜云艷等[5]采用空間聚類方法建立關(guān)于漁業(yè)數(shù)據(jù)和對(duì)應(yīng)水溫間的時(shí)空分布模型。袁紅春等[6]利用BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)西北太平洋柔魚漁獲情況。張?jiān)孪嫉萚7]利用案例推理預(yù)報(bào)東海區(qū)鮐魚中心漁場(chǎng)。但單純的空間聚類、專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)或案例推理方法并不能準(zhǔn)確地反應(yīng)漁業(yè)數(shù)據(jù)的時(shí)空分布。單獨(dú)的空間聚類只考慮空間因素, 忽略了其他因子的影響,從而導(dǎo)致預(yù)測(cè)誤差較大; 專家系統(tǒng)過于依靠專家知識(shí)經(jīng)驗(yàn); 人工神經(jīng)網(wǎng)絡(luò)的黑箱操作導(dǎo)致訓(xùn)練結(jié)果不易理解。上述原因阻礙了人工智能在漁情預(yù)報(bào)中的應(yīng)用。其他學(xué)者, 如 Masahiko等[8]、Mohri等[9]、Daniel等[10]分別研究了最適宜大眼金槍魚棲息的水溫范圍對(duì)產(chǎn)量的影響。日本的 Hiroaki[11]通過 GLM方法標(biāo)準(zhǔn)化印度洋大眼金槍魚的延繩釣漁獲量, 研究海洋環(huán)境與金槍魚漁獲量之間的關(guān)系。綜上, 現(xiàn)有方法僅用單一的模型描述整片海域中的漁情信息, 而同一片海域中不同位置的自然環(huán)境不同, 單一的模型不能準(zhǔn)確地預(yù)報(bào)整體漁情。同時(shí), 依據(jù)現(xiàn)有統(tǒng)計(jì)數(shù)據(jù)可知, 大量漁獲數(shù)據(jù)缺失, 因數(shù)據(jù)缺失而導(dǎo)致無(wú)法準(zhǔn)確描述及研究環(huán)境和漁獲量之間的關(guān)系, 也是漁情預(yù)報(bào)過程中亟待解決的問題之一[12]。本研究以印度洋大眼金槍魚為例[13,14], 提出一種基于空間自回歸和空間聚類的動(dòng)態(tài)漁情預(yù)測(cè)模型, 以豐富預(yù)測(cè)方法,提高預(yù)測(cè)水平。

1 材料與方法

1.1 數(shù)據(jù)來(lái)源

海洋環(huán)境數(shù)據(jù)(海面高度, 海表溫度, 葉綠素濃度)來(lái)源于美國(guó)國(guó)家海洋和大氣管理局, 漁業(yè)作業(yè)數(shù)據(jù)(漁獲量)來(lái)源于印度洋金槍魚委員會(huì)。

1.2 基于空間自回歸的數(shù)據(jù)預(yù)處理

1.2.1 數(shù)據(jù)的補(bǔ)缺

由于漁獲數(shù)據(jù)缺失嚴(yán)重, 若要利用該數(shù)據(jù)建立預(yù)測(cè)模型, 需進(jìn)一步補(bǔ)全缺失數(shù)據(jù)[15]。本研究在傳統(tǒng)用于補(bǔ)全數(shù)據(jù)模型的基礎(chǔ)上增加修正項(xiàng), 構(gòu)建空間自回歸模型。首先, 給定觀察數(shù)據(jù)為一個(gè)n維向量Y, 表示漁業(yè)產(chǎn)量數(shù)據(jù), 一個(gè)n×m的矩陣X為海洋環(huán)境數(shù)據(jù)(m為環(huán)境因子數(shù))。假設(shè)Y中每一個(gè)因變量yi都互相影響, 即:yi=f(yj),i≠j?;貧w方程可以修正成如下形式:

W是鄰接矩陣, 在回歸模型的空間拓展上起決定性作用。ρ是解釋變量和因變量之間空間獨(dú)立性強(qiáng)度的參數(shù)。殘差向量ε被假定為服從獨(dú)立同分布的標(biāo)準(zhǔn)正態(tài)分布,β是系數(shù)矩陣。

本研究用八-鄰居準(zhǔn)則構(gòu)建鄰接矩陣W。一個(gè)八-鄰居準(zhǔn)則構(gòu)建的矩陣見圖1。

圖1 八-鄰居鄰接矩陣Fig.1 An eight-neighborhood its adjacency matrix

圖1(a)表示空間上A、B、C、D 4個(gè)單元格的位置關(guān)系, 圖1(b)表示每個(gè)點(diǎn)與其余點(diǎn)位置的關(guān)系矩陣。以矩陣第二行為例, 第二行表示單元格 B與其余單元格的位置關(guān)系, 因B與A有相鄰的邊、與C共享一條邊和一個(gè)頂點(diǎn)、與 D有相接的頂點(diǎn), 所以第一列(A)為1, 第三列(C)為1, 第四列(D)為1, 其余位置為0。標(biāo)記每個(gè)單元格與其他單元格之間的關(guān)系后, 得到圖1(b)中以二進(jìn)制形式表示的鄰接矩陣。然后對(duì)鄰接矩陣中有標(biāo)記的數(shù)值進(jìn)行歸一化。具體方法為: 令每一行之和為 1, 即歸一化后的標(biāo)記值為 1除以該行不為0的數(shù)值的個(gè)數(shù)。以第二行為例, 有標(biāo)記的個(gè)數(shù)為3, 1/3約為0.3, 則每個(gè)有標(biāo)記的值歸一化后均為0.3。

當(dāng)ρ=0, 式(1)就變成傳統(tǒng)回歸方程。修正后的模型有以下優(yōu)點(diǎn): (1)殘差有很少的空間自相關(guān)性;(2)如果空間自相關(guān)系數(shù)在統(tǒng)計(jì)學(xué)上非常大, 就可以確定空間自相關(guān)存在的數(shù)量。這意味著因變量y變化的范圍是y到相鄰觀測(cè)值的平均值; (3)模型的擬合度很高。

選取產(chǎn)量數(shù)據(jù)不為零的數(shù)據(jù)作為數(shù)據(jù)集, 構(gòu)建空間自回歸模型。模型建立后, 對(duì)空間缺失值進(jìn)行插補(bǔ), 插補(bǔ)方式為

其中Yi為待預(yù)測(cè)的缺失產(chǎn)量數(shù)據(jù),表示該預(yù)測(cè)區(qū)域內(nèi)產(chǎn)量的平均值,Wi為空間標(biāo)準(zhǔn)加權(quán)矩陣W的第i行,Y是表示漁業(yè)產(chǎn)量的向量,Y中缺失產(chǎn)量用0表示。

1.2.2 數(shù)據(jù)的歸一化

為了研究印度洋大眼金槍魚延繩釣漁業(yè)產(chǎn)量與相應(yīng)棲息地海域海洋環(huán)境因子的關(guān)系, 需要建立一種客觀標(biāo)準(zhǔn)反映該區(qū)域的資源豐度。單位捕撈努力量漁獲量(Catch Per Unit Effort, CPUE)的大小常被作為資源豐度的相對(duì)指數(shù)來(lái)反映資源豐度的變化, 其定義為

其中,CPUE(i,j)代表以經(jīng)緯度(i,j)為起點(diǎn)的范圍5°×5°區(qū)域內(nèi)釣獲率,Nfish(i,j)為該范圍內(nèi)的漁獲尾數(shù),Nhook(i,j)為該范圍內(nèi)的下鉤枚數(shù)。CPUE(i,j)也可解釋為每千鉤上鉤的大眼金槍魚數(shù)量。再對(duì)單位捕撈努力量漁獲量進(jìn)行處理, 使用相對(duì)資源指數(shù)(Relative Abundance Index, RAI)構(gòu)建棲息地適宜性指數(shù)模型。相對(duì)資源指數(shù)由某一時(shí)間地點(diǎn)的單位捕撈努力量漁獲量值除以所有單位捕撈努力量漁獲量值中的最大值得到, 計(jì)算方法為

相對(duì)資源指數(shù)可看作反映棲息地質(zhì)量的指標(biāo),等價(jià)于實(shí)際的棲息地適宜指數(shù)。

1.3 基于空間聚類的漁區(qū)劃分

根據(jù)環(huán)境數(shù)據(jù)及漁獲數(shù)據(jù)的相關(guān)性, 利用每條數(shù)據(jù)的地理位置信息進(jìn)行 K-Means聚類, 把地理位置相對(duì)較近、漁獲數(shù)據(jù)之間相關(guān)系數(shù)較高的區(qū)域劃分為一類, 從而大大降低預(yù)測(cè)誤差??臻g中數(shù)據(jù)對(duì)象的記錄主要包括空間實(shí)體的位置、形狀以及對(duì)象之間的相互關(guān)系, 這種關(guān)系通常以坐標(biāo)或者拓?fù)涞男问奖硎?。本研究將?°×5°區(qū)域看作空間上的一個(gè)實(shí)體點(diǎn), 每個(gè)實(shí)體點(diǎn)包含地理位置數(shù)據(jù)(緯度, 經(jīng)度)和產(chǎn)量數(shù)據(jù)(棲息地適宜性指數(shù) HSI)。其中, 地理位置數(shù)據(jù)中的緯度和經(jīng)度為實(shí)體點(diǎn)的空間數(shù)據(jù), 產(chǎn)量數(shù)據(jù) HSI為實(shí)體點(diǎn)的屬性數(shù)據(jù)。結(jié)合空間實(shí)體點(diǎn)的空間數(shù)據(jù)和屬性數(shù)據(jù)等多方面因素考慮, 并參考大量有關(guān)聚類分析的文獻(xiàn)后[16-18], 設(shè)計(jì)如下適用于漁情預(yù)報(bào)的空間聚類算法:

算法1 空間聚類算法

輸入: 地理位置數(shù)據(jù)和產(chǎn)量數(shù)據(jù)

輸出: 聚類結(jié)果

步驟如下:

(1) 確定待聚類數(shù)據(jù)集D, 聚類數(shù)K, 預(yù)設(shè)迭代次數(shù)m和收斂條件;

(2) 初始化聚類重心Ci;

(3) 計(jì)算每個(gè)數(shù)據(jù)Di到各個(gè)Ci的距離, 選取最近的距離歸并到該類中;

(4) 更新重心Ci;

(5) 計(jì)算所有Ci值的變化;

(6) 直到滿足收斂條件或達(dá)到迭代次數(shù)m, 停止迭代。

其中聚類重心的計(jì)算方法如下:

X為聚類重心的經(jīng)度,Y為聚類重心的緯度,Mi為漁區(qū)i每個(gè)月的產(chǎn)量,Xi為漁區(qū)i重心點(diǎn)的經(jīng)度,Yi為漁區(qū)i重心點(diǎn)的緯度, 漁區(qū)的個(gè)數(shù)為k。通過該聚類方法可以把地理位置相對(duì)較近、漁獲數(shù)據(jù)之間相關(guān)系數(shù)較高的區(qū)域劃分為一類, 從而減少因不同地理位置或不同環(huán)境所引起的誤差。

1.4 基于非線性回歸的棲息地適宜性指數(shù)模型

HSI模型在20世紀(jì)80年代由美國(guó)魚類和野生動(dòng)物保護(hù)委員會(huì)提出[19-21], 被用來(lái)定量地描述野生動(dòng)物的棲息地質(zhì)量。

考慮到漁獲量的高低不僅與地理位置有關(guān), 還與魚類生存的環(huán)境因子, 如海表溫度(SST)、海面高度(SSH)和葉綠素濃度(CHL-a)等有關(guān)。因此, 本研究針對(duì)每個(gè)環(huán)境因子, 利用其和棲息地適宜性指數(shù)之間的關(guān)系, 分別計(jì)算其對(duì)大眼金槍魚產(chǎn)量影響的適宜性指數(shù)(Suitability Index, SI); 最后, 通過回歸分析關(guān)聯(lián)各種SI值得到綜合HSI模型(圖2)。

圖2 棲息地適宜性指數(shù)模型構(gòu)建方法Fig.2 Method for constructing the habitat suitability index model

利用綜合優(yōu)化分析計(jì)算軟件平臺(tái)——First Optimization的公式擬合工具箱, 對(duì)每個(gè)環(huán)境因子和其對(duì)應(yīng)的 RAI分別作非線性擬合, 把最佳擬合公式作為棲息地適宜性指數(shù)計(jì)算公式中的單項(xiàng)棲息地適宜性指數(shù)SI, 通過對(duì) 3種環(huán)境因子在不同月份的擬合結(jié)果比較可知, 3種環(huán)境因子與棲息地適宜性指數(shù)的擬合形式可用如下形式表示:

其 中,A= (a1,a2, … ,a10),B=(0 , 1,… ,9),X=(x1,x2,… ,xm)′為環(huán)境因子。因此, 在計(jì)算參數(shù)A時(shí),可先計(jì)算XB, 令Y=XB, 將非線性回歸形式轉(zhuǎn)為線性回歸形式:

計(jì)算完每一項(xiàng)SI之后, 本研究將棲息地適宜性指數(shù)模型設(shè)置為:

SI是單項(xiàng)棲息地適宜性指數(shù),d為回歸方程中的常數(shù)項(xiàng)。根據(jù)每個(gè)月不同的環(huán)境數(shù)據(jù)和棲息地適宜性指數(shù)數(shù)據(jù), 利用回歸方程(8)計(jì)算出參數(shù)a、b、c和d即可得到每個(gè)月的綜合棲息地適宜性指數(shù)模型。

2 實(shí)驗(yàn)過程與實(shí)驗(yàn)結(jié)果

2.1 實(shí)驗(yàn)過程

本研究的整個(gè)實(shí)驗(yàn)流程見圖3, 在數(shù)據(jù)預(yù)處理部分加入空間自回歸對(duì)缺失數(shù)據(jù)進(jìn)行補(bǔ)全; 然后利用空間聚類對(duì)補(bǔ)全后的數(shù)據(jù)進(jìn)行漁區(qū)劃分; 再對(duì)每個(gè)漁區(qū)分別建立棲息地適宜性指數(shù)模型; 最后通過捕撈點(diǎn)的地理位置和環(huán)境信息, 確定該點(diǎn)所屬漁區(qū),結(jié)合該漁區(qū)的預(yù)測(cè)模型對(duì)該點(diǎn)產(chǎn)量進(jìn)行預(yù)測(cè), 并與真實(shí)數(shù)據(jù)對(duì)比, 從而驗(yàn)證該模型。

圖3 實(shí)驗(yàn)流程及對(duì)應(yīng)方法Fig.3 Experimental process and corresponding methods

利用2005年1月~2010年12月印度洋大眼金槍魚的數(shù)據(jù)進(jìn)行建模。首先, 根據(jù)本研究提出的空間自回歸對(duì)缺損的數(shù)據(jù)進(jìn)行補(bǔ)全。從IOTC官方網(wǎng)站下載印度洋 40°S~15°N, 40°E~120°E 區(qū)域內(nèi)大眼金槍魚漁獲數(shù)據(jù)。根據(jù)文獻(xiàn)[13]中顯示, 印度洋大眼金槍魚除45°S以上的高緯度區(qū)域之外均有產(chǎn)量。但獲取的作業(yè)數(shù)據(jù)中, 許多地理位置沒有記錄相應(yīng)的產(chǎn)量數(shù)據(jù)。通過選取產(chǎn)量不為零的數(shù)據(jù)作為建立模型的數(shù)據(jù)集, 對(duì)產(chǎn)量的空間缺失值進(jìn)行插補(bǔ), 擴(kuò)充后續(xù)建模數(shù)據(jù)樣本。

以 2009年 1月數(shù)據(jù)為例, 先對(duì)東經(jīng)取正值, 西經(jīng)取負(fù)值, 北緯取 90-緯度值, 南緯取 90+緯度值,對(duì)環(huán)境數(shù)據(jù)進(jìn)行歸一化, 與漁業(yè)作業(yè)數(shù)據(jù)進(jìn)行匹配即可獲得適合后續(xù)聚類、回歸的數(shù)據(jù)樣本。表1為2009年1月經(jīng)過組織之后的數(shù)據(jù)樣本。

表1 2009年1月數(shù)據(jù)樣本(部分)Tab.1 Data sample in Jan 2009(partial)

然后根據(jù)算法1, 得到聚類結(jié)果。聚類數(shù)量根據(jù)實(shí)際應(yīng)用而定, 它的值會(huì)直接影響最終聚類結(jié)果,在實(shí)際應(yīng)用中K值通常取為2~5。因此, 本研究將K分別設(shè)置為2、3、4、5, 利用Matlab2012b進(jìn)行仿真實(shí)驗(yàn)。根據(jù)不同K值對(duì)數(shù)據(jù)進(jìn)行聚類, 得到所有數(shù)據(jù)點(diǎn)歸屬類別后, 逐類別進(jìn)行相關(guān)系數(shù)計(jì)算, 設(shè)xi=(xi1,xi2,...,xip)和xj=(xj1,xj2,...,xjp)是第i個(gè)和j個(gè)數(shù)據(jù)點(diǎn)觀測(cè)值, 兩個(gè)數(shù)據(jù)點(diǎn)之間相關(guān)系數(shù)為:

總體相關(guān)系數(shù)為:

通過算術(shù)平均方法得到不同K值下的相關(guān)系數(shù),表2為相關(guān)系數(shù)計(jì)算結(jié)果。

表2 K取不同數(shù)值的相關(guān)系數(shù)Tab.2 Correlation coefficients of different K values

根據(jù)計(jì)算結(jié)果, 當(dāng)K=3時(shí), 得到的相關(guān)系數(shù)最大。因此, 本研究將K值確定為3。

在K均值算法中, 聚類重心的確定對(duì)后續(xù)聚類結(jié)果有很大影響。由于聚類的目的是找到地理位置上相對(duì)集中的幾個(gè)區(qū)域, 從而減少回歸的誤差,而聚類的指標(biāo)是以距離為度量值, 因此, 本研究通過均勻劃分經(jīng)緯度選取初始聚類重心。由于研究區(qū)域?yàn)橛《妊?40°S~15°N, 40°E~120°E, 其經(jīng)向范圍較緯向范圍大, 因此, 本研究以赤道 0°為緯度基線, 以此基線平分經(jīng)度跨度, 東經(jīng)取正值, 西經(jīng)取負(fù)值, 北緯取 90-緯度值, 南緯取 90+緯度值,則初始中心的坐標(biāo)以經(jīng)緯度表示約為(0, 54), (0, 80)和(0, 106)。

令閾值為0.5, 將最終聚類迭代次數(shù)限定為1000次, 利用前文提出的空間聚類算法, 以表1的數(shù)據(jù)為例根據(jù)經(jīng)緯度數(shù)據(jù)以及HSI數(shù)據(jù), 對(duì)2009年1月份聚類結(jié)束后, 經(jīng)過組織得到表3。

表3 2009年1月數(shù)據(jù)聚類結(jié)果(部分)Tab.3 Results of data clustering in Jan 2009 (partial)

根據(jù)2005年1月至2010年12月的聚類結(jié)果, 類別 1為赤道~35°S、80°E~110°E 的東印度洋區(qū)域; 類別 2 為 10°N~10°S、50°E~85°E 熱帶印度洋區(qū)域; 類別 3 為赤道~35°S、30°E~55°E 的西印度洋區(qū)域。

將2005年1月~2010年12月每一個(gè)月的數(shù)據(jù)進(jìn)行聚類, 然后對(duì)所有數(shù)據(jù)進(jìn)行類別標(biāo)號(hào)。選取 2005年1月~2010年12月的金槍魚延繩釣產(chǎn)量數(shù)據(jù)和相關(guān)海洋環(huán)境因子作為建模數(shù)據(jù)。對(duì)每一個(gè)環(huán)境因子和產(chǎn)量分別作非線性擬合, 將最佳擬合公式作為棲息地適宜性指數(shù)計(jì)算公式中的單項(xiàng) SI, 再利用公式(8)計(jì)算出參數(shù)a、b、c和d即可得到每個(gè)月的綜合棲息地適宜性指數(shù)模型。

2.2 實(shí)驗(yàn)結(jié)果

本研究通過聚類過程發(fā)現(xiàn): 當(dāng)海表溫度在 26℃~29℃, 葉綠素濃度在(0.1~0.3)mg/m3, 海面高度較高時(shí), 棲息地適宜性指數(shù)較高, 這與文獻(xiàn)[13, 22~24]中的表述一致。

本研究以2005年至2010年的1月份數(shù)據(jù)為例,將棲息地適宜性指數(shù)大于 0.4的網(wǎng)格點(diǎn)在地圖上標(biāo)出, 結(jié)果發(fā)現(xiàn): 印度洋大眼金槍魚延繩釣的產(chǎn)量分布面較廣, 除 45°S以上的高緯度海域外, 幾乎整個(gè)印度洋海域, 均有其產(chǎn)量分布; 主要漁場(chǎng)集中在10°N~20°S, 50°E~85°E 的海域; 高產(chǎn)漁區(qū)以西印度洋為主; 東印度洋也有分布, 但產(chǎn)量明顯稀少。以上均與文獻(xiàn)[13]和文獻(xiàn)[25]中吻合。

由于在構(gòu)建棲息地適宜性指數(shù)模型之前對(duì)數(shù)據(jù)進(jìn)行了空間聚類, 將地理位置相對(duì)較近而且棲息地適宜性指數(shù)與環(huán)境因子相關(guān)性較高的數(shù)據(jù)樣本聚集到一起, 因此在模型檢驗(yàn)及后續(xù)預(yù)測(cè)中心漁場(chǎng)中,需要根據(jù)數(shù)據(jù)樣本到每個(gè)聚類重心的距離選取棲息地適宜性指數(shù)模型。

本研究采用 2011年 1~12月的數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證。針對(duì)每月數(shù)據(jù), 根據(jù)每條記錄對(duì)應(yīng)的經(jīng)緯度,計(jì)算其到3個(gè)聚類重心的距離, 確定其所屬類別。再將該記錄的環(huán)境數(shù)據(jù)代入相應(yīng)的棲息地適宜性指數(shù)模型, 得到對(duì)應(yīng)的棲息地適宜性指數(shù)估計(jì)值。最后在同一張圖中對(duì)比預(yù)測(cè)值與真實(shí)值得到圖4。

圖4 預(yù)測(cè)與真實(shí)數(shù)據(jù)比較Fig.4 Comparison of predicted and actual data

在圖4中橫坐標(biāo)表示每組數(shù)據(jù)的序號(hào), 圓點(diǎn)是實(shí)際HSI值, 折線為預(yù)測(cè)模型得到的HSI值, 由圖可知真實(shí)HSI最高值接近1.0, 但多數(shù)集中在0.4~0.6, 而預(yù)測(cè)值最高約為0.5, 且出現(xiàn)頻率較高, 與事實(shí)符合。

3 討論與結(jié)論

得到每個(gè)月的棲息地適宜性指數(shù)估計(jì)值之后, 計(jì)算其均方誤差(MSE), 圖5為本研究提出的基于空間聚類的漁情預(yù)測(cè)方法(Spatial Clustering Based Fishery Forecasting, SCBFF)和傳統(tǒng)線性回歸方法的誤差對(duì)比。

由圖5可知, 本研究提出的方法要優(yōu)于傳統(tǒng)的線性回歸方法, 這是因?yàn)閭鹘y(tǒng)的線性回歸預(yù)測(cè)方法并未考慮到因?yàn)閿?shù)據(jù)缺失而導(dǎo)致預(yù)測(cè)精度偏低的問題, 作者通過空間自回歸模型補(bǔ)全數(shù)據(jù), 從數(shù)據(jù)本身的角度出發(fā), 為之后的預(yù)測(cè)奠定了良好的基礎(chǔ)。此外傳統(tǒng)的預(yù)測(cè)方法是直接對(duì)整個(gè)漁區(qū)進(jìn)行建模預(yù)測(cè),并未考慮不同地理位置或不同環(huán)境所引起的偏差,作者充分考慮該偏差所引起的預(yù)測(cè)誤差較大的問題,根據(jù)環(huán)境數(shù)據(jù)隨著地理位置變化而變化的特點(diǎn), 采用基于空間聚類的漁區(qū)劃分方法, 將漁獲量之間相關(guān)性較高并且相對(duì)地理位置較近的數(shù)據(jù), 聚集在同一個(gè)類中, 對(duì)每個(gè)漁區(qū)分別建立模型, 有效地提高了預(yù)測(cè)精度。

圖5 SCBFF與線性回歸的均方誤差比較Fig.5 Comparison of MSE between SCBFF and linear regression

由于環(huán)境數(shù)據(jù)采集困難, 本研究?jī)H從海表溫度、海面高度和葉綠素濃度等 3個(gè)方面考慮海洋環(huán)境因子對(duì)金槍魚產(chǎn)量的影響, 但實(shí)際上還有許多影響印度洋金槍魚分布的因素, 包括海水鹽度、餌料生物分布等環(huán)境因子, 這為本課題的后續(xù)研究提供空間。同時(shí), 本研究能夠根據(jù)現(xiàn)有的 3種環(huán)境因子與棲息地適宜性指數(shù)之間的關(guān)系構(gòu)建出棲息地適宜性指數(shù)模型, 且平均預(yù)測(cè)性能良好, 但對(duì)于部分極值, 如棲息地適宜性指數(shù)非常高的區(qū)域并不能很好地預(yù)測(cè)出來(lái),這也將成為后期深入研究方向之一。

本研究針對(duì)傳統(tǒng)漁情預(yù)報(bào)方法由于精度偏低的問題, 利用空間自回歸、K均值空間聚類、非線性回歸等技術(shù)的優(yōu)點(diǎn), 提出一種基于空間自回歸和空間聚類的漁情預(yù)報(bào)模型。首先, 利用空間自回歸根據(jù)空間位置插補(bǔ)數(shù)據(jù)的能力, 插補(bǔ)缺損數(shù)據(jù), 從而補(bǔ)全數(shù)據(jù)。再利用基于空間聚類的漁區(qū)劃分方法, 對(duì)漁區(qū)進(jìn)行劃分。最后根據(jù)每一類中環(huán)境數(shù)據(jù)和產(chǎn)量數(shù)據(jù)之間的數(shù)學(xué)關(guān)系, 通過函數(shù)擬合與非線性回歸分析,得到每個(gè)不同漁區(qū)塊各自的棲息地適宜性指數(shù)模型。通過與傳統(tǒng)的金槍魚預(yù)測(cè)方法進(jìn)行對(duì)比試驗(yàn), 實(shí)驗(yàn)結(jié)果表明, 在提高模型擬合程度和減小預(yù)測(cè)誤差方面, 本方法要優(yōu)于傳統(tǒng)的漁情預(yù)報(bào)方法。

[1] 沈金鰲, 方瑞生.浙江近海冬汛帶魚漁獲量預(yù)報(bào)方法的探討[J].水產(chǎn)科技情報(bào), 1982, 5: 1-5.

[2] 陳新軍, 鄭波, 李綱.GLM和GAM模型研究東黃海鮐資源漁場(chǎng)與環(huán)境因子的關(guān)系[J].水產(chǎn)學(xué)報(bào), 2008,32(3): 379-386.

[3] 陳新軍.西北太平洋柔魚漁場(chǎng)與水溫因子的關(guān)系[J].上海海洋大學(xué)學(xué)報(bào), 1995, 3: 181-185.

[4] 陳新軍, 田思泉, 錢衛(wèi)國(guó).月相對(duì)北太平洋海域柔魚釣獲率的影響[J].海洋漁業(yè), 2006, 28 (2): 136-140.

[5] 杜云艷, 周成虎, 崔海燕, 等.遙感與 GIS支持下的海洋漁業(yè)空間分布研究——以東海為例[J].海洋學(xué)報(bào), 2002, 24(5): 57-63.

[6] 袁紅春, 顧怡婷, 汪金濤, 等.西北太平洋柔魚中長(zhǎng)期預(yù)測(cè)方法研究[J].海洋科學(xué), 2013, 37(10): 65-70.

[7] 張?jiān)孪? 丘仲鋒, 伍玉梅, 等.基于案例推理的東海區(qū)鮐魚中心漁場(chǎng)預(yù)報(bào)[J].海洋科學(xué), 2009, 33(6): 8-11.

[8] Masahiko M, Yasuaki T.Vertical distribution and optimum temperature of bigeye tuna in the eastern tropical India Ocean based on deep tuna longline catches[J].Journal of National Fisheries University, 1997, 46(1):13-20.

[9] Mohri M, Hanamoto E, Takeuchi S.Optimum water temperatures for bigeye tuna in the Indian Ocean as seen from tuna longline catches[J].Nippon Suisan Gakkaishi, 1996, 62: 761-764.

[10] Daniel G, Francis M.Comparative analysis of the exploitation of bigeye tuna in the Indian and eastern Atlantic oceans with emphasis on purse seine[R].Victoria:IOTC Proceedings, 1999, 2: 158-171.

[11] Hiroaki O, Naozumi M, Takayuki M.GLM analyses for standardization of Japanese longline cpue for bigeye tuna in the indian ocean applying environmental factors[R].Japan: IOTC Proceedings, 2001.

[12] Menard F, Marsac F, Bellier B, et al.Climatic oscillations and tuna catch rates in the Indian Ocean: a wavelet approach to time series analysis[J].Fisheries Oceanography, 2007, 16(1): 95-104.

[13] 苗振清, 黃錫昌.遠(yuǎn)洋金槍魚漁業(yè)[M].上海: 上??茖W(xué)技術(shù)文獻(xiàn)出版社, 2003: 24-26.

[14] 李軍, 李志凌, 葉振江.大眼金槍魚漁業(yè)現(xiàn)狀和生物學(xué)研究進(jìn)展[J].齊魯漁業(yè), 2005, 22(12): 35-38.

[15] Herrera M L, Pierre M J.Review of the statistical data available for the tropical tuna species[R].Maldives: Indian Ocean Tuna Commission, 2011.

[16] Lin C R, Liu K H, Chen M S.Dual clustering: integrating data clustering over optimization and constraint domains[J].IEEE Transactions on Knowledge and Data Engineering, 2005, 17(5): 628-637.

[17] Zhou J G, Guan J H, Li PX.A Dual clustering algorithm for distributed spatial databases[J].Geo2spatial Information Science, 2007, 10(2): 137-144.

[18] 柳盛, 吉根林.空間聚類技術(shù)研究綜述[J].南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版), 2010, 10 (2): 57-62.

[19] 王家樵, 朱國(guó)平, 許柳雄.基于 HSI模型的印度洋大眼金槍魚棲息地研究[J].海洋環(huán)境科學(xué), 2009, 28(6):739-742.

[20] 陳新軍, 馮波, 許柳雄.印度洋大眼金槍魚棲息地指數(shù)研究及其比較[J].中國(guó)水產(chǎn)科學(xué), 2008, 15(2):269-278.

[21] 胡振明.利用棲息地適宜指數(shù)分析秘魯外海莖柔魚漁場(chǎng)分布[D].上海: 上海海洋大學(xué), 2009.

[22] 楊勝龍, 張禹, 樊偉, 等.熱帶印度洋大眼金槍魚漁場(chǎng)時(shí)空分布與溫躍層關(guān)系[J].中國(guó)水產(chǎn)科學(xué), 2012,19(4): 679-689.

[23] 曹曉怡, 周為峰, 樊偉, 等.印度洋大眼金槍魚、黃鰭金槍魚延繩釣漁場(chǎng)重心變化分析[J].上海海洋大學(xué)學(xué)報(bào), 2009, 18(4): 466-471.

[24] 陳雪冬, 崔雪森.衛(wèi)星遙感在中東太平洋大眼金槍魚漁場(chǎng)與環(huán)境關(guān)系的應(yīng)用研究[J].遙感信息, 2006, 1:25-28.

[25] 楊勝龍, 馬軍杰, 伍玉梅, 等.印度洋大眼金槍魚和黃鰭金槍魚漁場(chǎng)水溫垂直結(jié)構(gòu)的季節(jié)變化[J].海洋科學(xué), 2012, 36(7): 97-103.

猜你喜歡
金槍魚棲息地聚類
金槍魚淹死事件
可以加速的金槍魚機(jī)器人
金槍魚與海豚
基于K-means聚類的車-地?zé)o線通信場(chǎng)強(qiáng)研究
國(guó)內(nèi)新型遠(yuǎn)洋金槍魚圍網(wǎng)漁船首航
BEAN SCENES
抵達(dá)棲息地
基于高斯混合聚類的陣列干涉SAR三維成像
基于Spark平臺(tái)的K-means聚類算法改進(jìn)及并行化實(shí)現(xiàn)
基于改進(jìn)的遺傳算法的模糊聚類算法