張麗梅,王成智,趙學達
(1.大連海洋大學 理學院,遼寧 大連116023;2.大連海洋大學 信息工程學院 遼寧省海洋信息技術重點實驗室,遼寧 大連116023)
隨著時間序列理論研究的深入,對于少數(shù)據(jù)、貧信息且近似服從指數(shù)分布的單變量灰色系統(tǒng)理論與實證研究也越來越深入[1-2]。在理論的推廣與擴展中,多變量灰色模型及其應用[3-4]解決了以往用單變量建模時未考慮序列間內(nèi)在復雜關系等的不足,蔣輝[5]還探討了將多變量灰色系統(tǒng)與支持向量機進一步結合的模型構建方法。應用多變量灰色系統(tǒng)建??梢詫⑿蛄兴苷?、經(jīng)濟、環(huán)境、人文、供需關系等諸多影響因素反映到模型中,因而具有廣泛的應用前景。近年來,隨著人們對海洋的關注和對數(shù)據(jù)分析與處理能力的增強,對于水產(chǎn)數(shù)據(jù)所形成的時間序列的實證分析被廣泛研究并形成了許多有意義的結論。周井娟等[6-7]分別對國內(nèi)海洋捕撈產(chǎn)量及海水養(yǎng)殖產(chǎn)量進行了分析,在單一使用ARMA 模型或Logistic 模型擬合的基礎上,重點對實證進行了研究。由于海洋捕撈產(chǎn)量及海水養(yǎng)殖產(chǎn)量具有內(nèi)在的聯(lián)系,所以單一建模還未能將序列間的內(nèi)在關系反映到模型中。
本研究中,所用數(shù)據(jù)來源于2012年中國漁業(yè)統(tǒng)計年鑒[8]。以1986—2010年調(diào)整后的中國水產(chǎn)品產(chǎn)量所包括的海洋捕撈、遠洋漁業(yè)、海水養(yǎng)殖、淡水捕撈、淡水養(yǎng)殖產(chǎn)量5 個時間序列為實證研究示例,在考慮這5 個時間序列的內(nèi)在結構與關聯(lián)關系的前提下,運用多變量灰色系統(tǒng)對其建模,實現(xiàn)用相關序列構建同一模型的近似序列關聯(lián)建模方法。通過對水產(chǎn)品產(chǎn)量數(shù)據(jù)所包含的5 個時間序列進行分析,發(fā)現(xiàn)海洋捕撈、海水養(yǎng)殖、淡水養(yǎng)殖產(chǎn)量時間序列比較接近,而遠洋漁業(yè)、淡水捕撈產(chǎn)量時間序列比較接近,為此分兩組數(shù)據(jù)進行比較(圖1)。這些時間序列所表現(xiàn)出的內(nèi)在數(shù)學關系對有關部門制定可持續(xù)發(fā)展戰(zhàn)略以及研究人員從事科學研究具有重要意義。
時間序列的多變量灰色模型MGM(1,n)能夠對多組時間序列統(tǒng)一構建一組n 元常微分方程組,它是單一灰色系統(tǒng)模型GM(1,1)的推廣。對于本例,如果直接按5 個時間序列建立MGM(1,5)模型,確實實現(xiàn)了對數(shù)據(jù)間關系的極大統(tǒng)一,但由于這5 組序列間的關聯(lián)度、序列趨勢可能具有較大差異,所以必須先對序列間的灰色關聯(lián)度進行分析,以確定直接建立MGM(1,5)模型是否具有可行性。
圖1 中國1986—2010年調(diào)整后的水產(chǎn)品產(chǎn)量時間序列圖Fig.1 Adjustment time series diagrams of partial outputs of fish and fishery products in China from 1986 to 2010
灰色關聯(lián)度分析是根據(jù)序列曲線幾何形狀的相似程度來判斷序列是否緊密的方法。曲線形狀越接近,相應序列之間的關聯(lián)度越大,反之,曲線形狀越偏離,相應序列之間的關聯(lián)度就越小。目前,已經(jīng)有許多關聯(lián)度的量化模型,本研究中選用文獻[9]中給出的方法,對上述5 組時間序列的灰色關聯(lián)度進行判斷。
設水產(chǎn)品產(chǎn)量所包含的海洋捕撈、遠洋漁業(yè)、海水養(yǎng)殖、淡水捕撈、淡水養(yǎng)殖產(chǎn)量為矩陣的列指標,按序分別記為序列1、序列2、序列3、序列4、序列5。從1986—2010年每一年的海洋捕撈、遠洋漁業(yè)、海水養(yǎng)殖、淡水捕撈、淡水養(yǎng)殖產(chǎn)量數(shù)據(jù)構成矩陣的一行,即每一年各指標值形成矩陣的一個行,這樣形成的矩陣記為A25×5。
首先將第一列海洋捕撈數(shù)據(jù)作為參考序列,比較其他序列與之關聯(lián)的程度。記
則第1 列與第j 列(j=2,3,4,5)之間的灰色關聯(lián)度記為
式中,ξ=0.5 為分辨系數(shù),通常取在(0,1)之間。
據(jù)此得出序列1 與序列2、序列3、序列4、序列5 的灰色關聯(lián)度分別為0.768 269、0.927 187、0.785 911、0.900 688。序列1 與序列3 以及序列1與序列5 的關聯(lián)度均大于0.9,據(jù)此確定序列1、序列3、序列5 為一組進行聯(lián)合建模,同時序列1、序列3、序列5 所表示的海洋捕撈、海水養(yǎng)殖和淡水養(yǎng)殖產(chǎn)量的各個單序列均具有累加數(shù)據(jù)近似服從指數(shù)分布的特性,因此,擬對此建立多變量灰色MGM(1,3)模型。
又以序列2 作為參考序列計算其與序列4 之間的灰色關聯(lián)度,其值為0.806 975,類似地,將序列2 與序列4 聯(lián)合建立多變量灰色MGM(1,2)模型。
設有n 個單項時間序列,每個序列有m 個數(shù)據(jù),將整體灰色序列記為
多變量灰色模型MGM(1,n)為n 元常微分方程組:
則式(4)可簡記為
式中,A=(aij)n×n,B=(b1b2… bn)T。
式(5)的連續(xù)解為
式中,E 為n 階單位矩陣。
為辨別參數(shù)矩陣A和B,需要將式(4)離散化,并用最小二乘法求解,這里僅給出獲得辨別參數(shù)矩陣A和B 的步驟,更詳細的討論見文獻[3,9 -10]。設參數(shù)矩陣A和B 的辨別矩陣分別為
這些列形成如下矩陣:
則由最小二乘法可得矩陣A和B 的辨別矩陣。
式中:
這樣MGM(1,n)模型的計算值為
基于上述MGM(1,n)模型的構建原則,以及根據(jù)灰色關聯(lián)度所做的序列組的劃分,所建立的模型如下:
對1986—2010年海洋捕撈、海水養(yǎng)殖、淡水養(yǎng)殖產(chǎn)量時間序列所建立的MGM(1,3)模型為
原數(shù)據(jù)序列與擬合數(shù)據(jù)序列的效果見圖2。根據(jù)平均預測誤差計算公式:計算出海洋捕撈、海水養(yǎng)殖、淡水養(yǎng)殖產(chǎn)量及其擬合數(shù)據(jù)的平均預測誤差分別為0.073 910、0.073 443、0.063 205,結果顯示,所建立的模型對海洋捕撈、海水養(yǎng)殖、淡水養(yǎng)殖產(chǎn)量均具有較好的擬合度。
同理對1986—2010年遠洋漁業(yè)、淡水捕撈產(chǎn)量時間序列所建立的MGM(1,2)模型為
原數(shù)據(jù)序列與擬合數(shù)據(jù)序列的效果見圖3,根據(jù)式(10)計算出兩個序列的平均預測誤差分別為0.084 695、0.098 812。無論是圖示還是平均預測誤差均表明,對遠洋漁業(yè)、淡水捕撈產(chǎn)量時間序列的擬和不如對海洋捕撈、海水養(yǎng)殖、淡水養(yǎng)殖產(chǎn)量時間序列的擬和效果好。
根據(jù)現(xiàn)有模型對2011年數(shù)據(jù)進行短期預測,對這5 個時間序列分別用公式(9)、(11)進行預測,預測結果與相對誤差如表1所示。從表1可見,總體上預測值與實際值之間的平均相對誤差在較小的范圍內(nèi),但由于數(shù)據(jù)受到當年政治、經(jīng)濟等諸多不可預測因素的影響,因此,短期預測的結果僅可以作為趨勢參考,如果作為數(shù)據(jù)參考應將其擴大至參考區(qū)間。
表1 2011年水產(chǎn)品產(chǎn)量實際值及其預測值的比較Tab.1 Comparison of the actual volumes and their fitting data of fish and fishery products in China in 2011 萬t
圖2 海洋捕撈、海水養(yǎng)殖、淡水養(yǎng)殖產(chǎn)量時間序列及其擬合數(shù)據(jù)的比較Fig.2 Comparison charts among the time series of the output of marine capture,output of mariculture,and output of freshwater culture and their fitting data apart
圖3 遠洋漁業(yè)、淡水捕撈產(chǎn)量時間序列及其擬合數(shù)據(jù)的比較Fig.3 Comparison of the output of distance fisheries,the output of freshwater capture and their fitting data apart
本研究中依據(jù)灰色關聯(lián)關系和多變量灰色MGM(1,n)模型方法,對1986—2011年水產(chǎn)品產(chǎn)量數(shù)據(jù)序列進行了實證分析。先對水產(chǎn)品產(chǎn)量所包含的5 組時間序列(即海洋捕撈、遠洋漁業(yè)、海水養(yǎng)殖、淡水捕撈、淡水養(yǎng)殖產(chǎn)量)用灰色關聯(lián)度方法進行了分類。根據(jù)實際序列情形,將關聯(lián)度大于0.9 的海洋捕撈、海水養(yǎng)殖、淡水養(yǎng)殖產(chǎn)量時間序列分為一組并建立了MGM(1,3)模型,由于這3 組序列關聯(lián)度高且單個序列累加數(shù)據(jù)近似服從指數(shù)分布,因而收到較好的擬合效果。將關聯(lián)度大于0.8 而未達到0.9 的遠洋漁業(yè)、淡水捕撈產(chǎn)量兩個時間序列分為一組并采用MGM(1,2)模型也進行了建模,由于這兩組時間序列均存在指數(shù)函數(shù)偏離現(xiàn)象,因此,模型擬合精度略有欠缺。總之,本研究中對多組時間序列所采用的分組建模方法考慮了序列間的內(nèi)在聯(lián)系,避免了分別使用單一序列建模割裂序列相互制約因素的情況發(fā)生,為揭示中國歷年水產(chǎn)品產(chǎn)量各序列間的內(nèi)在聯(lián)系與總體趨勢提供了行之有效的方法,對海洋領域中同類問題的研究具有借鑒作用。
[1]李樹文,王平,于虎廣.GM(0,n)模型在河流徑流量預測中的應用[J].應用技術,2012,225(10):100 -102.
[2]謝乃明,劉思峰.GM(n,h)模型建模序列數(shù)據(jù)數(shù)乘特性變換研究[J].控制與決策,2009,24(9):1294 -1299.
[3]鄭樹清,馬靖忠,關軍.多變量灰色模型在預測中的應用[J].河北大學學報,2006,26(4):350 -353.
[4]石世云.多變量灰色模型MGM(1,n)在變形預測中的應用[J].測繪學報,1998,10:9 -18.
[5]蔣輝.基于MGM(1,n)模型的多元核支持向量回歸預測[J].數(shù)學的實踐與認識,2011,41(9):193 -200.
[6]周井娟,林堅.我國海洋捕撈產(chǎn)量波動影響因素的實證分析[J].經(jīng)濟技術,2008,27(6):64 -68.
[7]周井娟,林堅.我國海水養(yǎng)殖產(chǎn)量波動影響因素的實證分析[J].西北農(nóng)林科技大學學報,2008,8(5):48 -51.
[8]2012 中國漁業(yè)統(tǒng)計年鑒(附錄)[M].北京:中國農(nóng)業(yè)出版社,2012.
[9]鄧聚龍.灰色系統(tǒng)[M].北京:國防工業(yè)出版社,1998:34 -90.
[10]姚德民,李漢玲.系統(tǒng)工程實用教程[M].哈爾濱:哈爾濱工業(yè)大學出版社,2002:85 -122.