摘要:為分析某水域船舶流特征和運行規(guī)律,量化研究船舶流到港規(guī)律,為港口營運和船舶交通管理(vessel traffic services,VTS)提供數(shù)據(jù)支持,以洋山港水域2020年66 d內(nèi)連續(xù)的1387條VTS實測船舶流記錄數(shù)據(jù)為統(tǒng)計樣本,基于矩估計理論的K-S檢驗和χ2檢驗,從擬合最優(yōu)的角度對船舶到港情況進行參數(shù)估計。結(jié)果表明,洋山港水域VTS報告的船舶在8、9月的船舶流樣本服從正態(tài)分布,7月船舶流樣本不服從泊松分布和正態(tài)分布,證明船舶流的分布特征隨環(huán)境和時間因素變化顯著,僅采用泊松分布或正態(tài)分布并不能全面描述水域交通流特征。相關(guān)研究結(jié)論可為船舶流特征分析、通航調(diào)度等相關(guān)研究提供借鑒和參考。
關(guān)鍵詞:正態(tài)分布;泊松分布;K-S檢驗;χ2檢驗;船舶流
中圖分類號:U652.1+4;U691文獻標(biāo)志碼:A文章編號:1672-0032(2023)01-0102-08
引用格式:劉超.洋山港VTS報告船舶流的統(tǒng)計特性[J].山東交通學(xué)院學(xué)報,2023,31(1):102-109.
LIU Chao. Statistical characteristics of vessel flow in VTS reports in Yangshan Port[J].Journal of Shandong Jiaotong University,2023,31(1):102-109.
0 引言
研究水路運輸中的交通流需要分析水域通航船舶流特征和運行規(guī)律,尤其短時間間隔內(nèi)一定運行強度下的船舶流分布特征,為港口營運和船舶交通管理(vessel traffic services,VTS)的監(jiān)控、港口調(diào)度、進出港船舶流量統(tǒng)計等工作提供理論參考,為提高通航安全、擴大航道通過能力等提供數(shù)據(jù)支持。在傳統(tǒng)觀點中,通常假設(shè)船舶到港時間服從隨機分布,即船舶到港頻率與實際情況無直接關(guān)聯(lián)。但劉敬賢等[1]收集天津港某一主航道內(nèi)歷史船舶交通流,采用分布統(tǒng)計方法對船舶到港時間進行分布統(tǒng)計擬合,發(fā)現(xiàn)船舶在1 d不同時刻到達該港口的規(guī)律明顯服從正態(tài)分布,并求得該水域?qū)?yīng)的分布參數(shù);余勁等[2]采用正態(tài)分布模型描述船舶在1 d不同時刻到達西江航道的規(guī)律,較好地表征水域內(nèi)船舶的到港規(guī)律;文獻[3-7]基于船舶大數(shù)據(jù)的交通狀態(tài)識別和神經(jīng)網(wǎng)絡(luò)預(yù)測交通流量;吳中等[8]基于場方法分析和預(yù)測船舶交通流。但正態(tài)分布模型在預(yù)測船舶的到港規(guī)律時存在局限性,主要問題是表征參數(shù)過于簡化,無法精確表達船舶到港規(guī)律的時序特征。
本文以洋山港2020年66 d內(nèi)連續(xù)的VTS中心報告船舶數(shù)為統(tǒng)計樣本,對其是否服從泊松分布或正態(tài)分布進行卡方檢驗(χ2檢驗)和柯爾莫哥洛夫-斯摩洛夫(Kolmogorov-Smirnov,K-S)檢驗。
1 統(tǒng)計分析方法
傳統(tǒng)的船舶流到港規(guī)律統(tǒng)計目標(biāo)是通過分析特定水域內(nèi)船舶的到達時序規(guī)律,預(yù)測該水域內(nèi)未來一段時間內(nèi)的到港船舶數(shù)。研究的基本步驟[9-11]為:樣本采集→樣本參數(shù)提取→分布假設(shè)→分布假設(shè)檢驗→樣本分布函數(shù)擬合。例如,研究船舶到港規(guī)律時,可在收集數(shù)據(jù)的基礎(chǔ)上,假設(shè)該數(shù)據(jù)反映船舶在不同時刻的到港數(shù)量分布符合泊松分布或正態(tài)分布,然后通過提取樣本特征參數(shù)估計總體特征值或假設(shè)分布中的待定參數(shù),建立一個完整的分布函數(shù),進行下一步假設(shè)有效性檢驗。
傳統(tǒng)的分布假設(shè)檢驗方法包括正態(tài)概率紙法、夏爾羅-威爾克(Shapir-Wilk,W)檢驗法、達戈斯提諾(D′Agostino,D)檢驗法、χ2檢驗法,K-S檢驗法等,本文選取χ2檢驗法和K-S檢驗法對船舶到港規(guī)律分布假設(shè)進行檢驗,這2種方法不受總體分布的限制,具有較強的通用性。
1.1 χ2檢驗
χ2檢驗是英國人Pearson于1900年提出的一種統(tǒng)計方法,也稱作皮爾遜檢驗[3]。該方法是將采集的樣本數(shù)據(jù)按大小排序,采用特定規(guī)則界定各條數(shù)據(jù)對應(yīng)的區(qū)間,將樣本數(shù)據(jù)劃分為m個升序區(qū)間,構(gòu)建檢驗函數(shù)為
式中:Ni為各區(qū)間對應(yīng)的試驗觀測樣本i的觀察值,ni為對應(yīng)區(qū)間概率。當(dāng)數(shù)據(jù)分組數(shù)m足夠大(m>>1)或Ni足夠大時,統(tǒng)計量χ2趨于卡方分布。其分布自由度為m-r-1,r為假設(shè)分布中估計的參數(shù)個數(shù),與m相比,當(dāng)r相對較小時,自由度可近似為m-1。
計算卡方積累函數(shù)
P=(χ2|m-1),
假設(shè)其符合非完全Gamma函數(shù)統(tǒng)計規(guī)律,對應(yīng)的Gamma互補函數(shù)
Q(χ2|m-1)=1-P =(χ2|m-1), ???(2)
式中Q為驗證分布的可信度假設(shè)參數(shù)。
區(qū)間假設(shè)對最終的檢驗結(jié)果有一定影響,當(dāng)區(qū)間間隔距離符合平均分布時,擬合優(yōu)度檢驗過程密度函數(shù)可能產(chǎn)生明顯的拖尾;當(dāng)假設(shè)區(qū)間間隔距離存在差異但各區(qū)間數(shù)據(jù)量相等時,該累積密度函數(shù)中存在的主峰值大小及其函數(shù)表征將對統(tǒng)計結(jié)果造成顯著影響。出現(xiàn)以上問題時,通常進行小區(qū)間合并或截尾。
1.2 K-S檢驗
K-S檢驗主要通過計算擬合殘差的方式進行樣本高階檢驗[12-13],該檢驗假設(shè)特定函數(shù)SN(x)為已知分布函數(shù)(如正態(tài)分布、卡方分布等),PN(x)為收集樣本的假設(shè)分布函數(shù),通過計算已知分布函數(shù)和假設(shè)分布函數(shù)在各連續(xù)或非連續(xù)區(qū)間的差值積累分布,并選取最大差值作為函數(shù)擬合精確表征。K-S檢驗的最大差值
式中N為試驗數(shù)據(jù)具體數(shù)量。
如果Dobs<0.05,認為該假設(shè)通過K-S檢驗,樣本數(shù)據(jù)服從指定分布;如果Dobs≥0.05,認為假設(shè)分布不成立。本文定義K-S檢驗標(biāo)準(zhǔn)為
P[D>Dobs]=Qks(λ) , ???(4)
2 船舶流數(shù)據(jù)處理
根據(jù)洋山港VTS的船舶報告資料,采集到2020-07-01—09-04每日到港船舶數(shù),并將其作為船舶流概率分布研究的樣本。由于數(shù)據(jù)統(tǒng)計齊全且樣本點眾多,因此將7月的549個樣本點作為樣本Ⅰ,8月的744個樣本點作為樣本Ⅱ, 9月的94個樣本點作為樣本Ⅲ。為分析同一水域船舶流是否具有一定特征,對3個樣本分別作假設(shè)檢驗。船舶流強度(艘/h)特征統(tǒng)計如表1所示。
為研究船舶時序特征,根據(jù)到港船舶數(shù)進行船舶分組,區(qū)間間隔最低為1艘,統(tǒng)計該水域7~9月內(nèi)到港船舶數(shù),計算對應(yīng)的船舶到港頻率[14-19]
式中:k為每h最大到港船舶數(shù),ti為每h到港i艘船舶所需時間。
采用式(5)進行計算,結(jié)果如圖1所示。
由圖1可知:該水域船舶到港存在一定規(guī)律,船舶流強度多為5~22 艘/h。7月每h到港8條船的頻率最高,約為9%;8月每h船舶到港11艘的頻率最高,約為10%;9月每h船舶到港13艘的頻率最高,約為13%。根據(jù)圖1并參照以往經(jīng)驗,假設(shè)船舶流服從泊松分布或正態(tài)分布,檢驗該水域每月到港船舶分布是否符合相應(yīng)分布假設(shè)。
3 VTS報告的船舶流分析
3.1 泊松分布的假設(shè)檢驗
根據(jù)洋山港VTS報告的船舶流特征統(tǒng)計量,對到港船舶分布進行泊松分布的χ2檢驗和K-S檢驗,并在這2種假設(shè)檢驗中選擇相對快捷的檢驗方法進行正態(tài)擬合。
假設(shè)到港船舶數(shù)服從泊松分布,則在數(shù)據(jù)樣本基礎(chǔ)上,該水域某1 h內(nèi)出現(xiàn)n艘船的概率
P(n)=(φt)ne-λt/n! , ???(6)
式中:t為間隔時間,t=1 h;φ為分布假設(shè)中估計的參數(shù)個數(shù),一般以先驗值為依據(jù),采用極大似然估計法估計,即φ等于觀測樣本均值(在實踐中還可將φ再放寬20%),式(6)變?yōu)?/p>
根據(jù)式(1)采用χ2檢驗對3個子樣本進行泊松分布的假設(shè)檢驗,計算結(jié)果(經(jīng)過截尾處理)為:
1)樣本Ⅰ的χ2=319.97,在顯著水平為0.05時χ2(17-1-1)的極限值為24.996;
2)樣本Ⅱ的χ2=350.79,在顯著水平為0.05時χ2(18-1-1)的極限值為26.296;
3)樣本Ⅲ的χ2=41.20,在顯著水平為0.05時χ2(10-1-1)的極限值為15.507。
3個子樣本的計算結(jié)果均大于顯著水平為0.05下χ2的極限值,說明在等間隔內(nèi)出現(xiàn)的到港船舶數(shù)不符合泊松分布。采用χ2檢驗時,計算過程中如果理論頻數(shù)nipi<5(ni為某船舶在區(qū)間i到達數(shù)量數(shù),pi為對應(yīng)的概率),則需要合并處理,并且根據(jù)實際需要,將3個子樣本都進行截尾處理[12-17]。由于計算量較大,僅給出樣本Ⅲ進行χ2檢驗的過程,如表2所示(加粗?jǐn)?shù)值為截尾處理的結(jié)果)。
由表2可知:樣本Ⅲ通過相應(yīng)檢驗,其擬合分布模型較為可信。采用χ2檢驗對3個樣本進行泊松分布的假設(shè)檢驗,計算結(jié)果分別為0.145 38、0.135 10、0.176 84,而在顯著水平為0.05下樣本II和樣本III的檢驗結(jié)果分別是0.049 60、0.138 20。3個子樣本計算結(jié)果均大于相應(yīng)的χ2檢驗極限值。通過χ2檢驗,洋山港VTS報告船舶在等間隔內(nèi)的出現(xiàn)規(guī)律不符合泊松分布的假設(shè)。χ2檢驗法易受區(qū)間及區(qū)間容量影響,對具體分布需進行特殊處理[20-21],難度較大,本文試驗采用截尾法也不能完全消除誤差,參數(shù)估計效果精確度較低[22]。
仍以樣本Ⅲ進行K-S檢驗為例給出計算結(jié)果,如表3所示。
由表3可知:理論上K-S檢驗的靈敏度較高,且不受分區(qū)間的影響。K-S檢驗還可采用MATLAB編程代替數(shù)據(jù)計算,檢驗過程快捷、簡便。
3.2 基于MATLAB的正態(tài)分布假設(shè)檢驗
在MATLAB環(huán)境下對3個子樣本的正態(tài)分布做K-S檢驗,具體步驟為:1)將統(tǒng)計的樣本值給變量a賦值;2)基于mean和var命令計算統(tǒng)計樣本均值μ和方差σ2;3)采用Kstest命令調(diào)用K-S檢驗函數(shù),判斷真實結(jié)果與仿真結(jié)果間差值之和是否小于0.05;4)判斷該分布函數(shù)假設(shè)是否通過檢驗[23-25]。收集樣本的分布假設(shè)檢驗結(jié)果,如表4所示。由表4可知:7月真實結(jié)果與仿真結(jié)果間差值累積之和大于0.05,8、9月小于0.05。各樣本船舶流強度擬合結(jié)果如表5所示。3個子樣本正態(tài)分布擬合情況如圖2所示。
由表4、5及圖2可知:樣本I的正態(tài)分布擬合結(jié)果不理想,樣本II、III正態(tài)分布擬合結(jié)果通過檢驗。
所分析的船舶流樣本是連續(xù)統(tǒng)計且數(shù)據(jù)可靠,但洋山港VTS監(jiān)控水域船舶流空間分布復(fù)雜,存在多個報告線,并且船舶有進有出,易造成數(shù)據(jù)統(tǒng)計上的誤差,對分析船舶流特征不利。
為減小誤差,在χ2檢驗中合并小區(qū)間,3次χ2檢驗均采用截尾法。為進一步驗證該水域船舶流的特征,在消除部分時間敏感數(shù)據(jù),僅將每天07:00—21:00每h的船舶流情況作為新樣本進行K-S檢驗,檢驗結(jié)果沒有改變,即8、9月船舶流樣本服從正態(tài)分布,7月船舶流樣本不服從泊松分布和正態(tài)分布。
理論上來說,船舶流到港是隨機事件,應(yīng)該服從某一概率分布。本文僅對該水域的船舶流進行泊松分布和正態(tài)分布的假設(shè)檢驗,對交通流分布擬合還可考慮采用其他函數(shù)分布描述水域交通流分布情況,包括χ2分布、伽瑪分布、對數(shù)正態(tài)分布等概率分布函數(shù)。
4 結(jié)語
對洋山港VTS報告船舶流進行統(tǒng)計分析,采用χ2檢驗和K-S檢驗對其概率分布進行泊松分布假設(shè)檢驗,檢驗結(jié)果表明洋山港船舶流不服從泊松分布;采用MATLAB軟件對其進行正態(tài)分布假設(shè)的K-S檢驗,發(fā)現(xiàn)洋山港的船舶流正態(tài)分布特征不明顯,其中8、9月部分連續(xù)數(shù)據(jù)服從正態(tài)分布。因水域特征等不同因素影響,船舶流的分布特征不一定局限于泊松分布和正態(tài)分布2種常規(guī)分布上,研究結(jié)論可為船舶流的后續(xù)研究提供借鑒和參考。
參考文獻:
[1]劉敬賢,李云斌.天津港主航道船舶到達規(guī)律的統(tǒng)計分析[J].武漢理工大學(xué)學(xué)報(交通科學(xué)與工程版), 2008, 32(2):351-353.
LIU Jingxian, LI Yunbin. Distribution regularity analysis of ship arrival and deparment at the Tianjin Port main channel[J].Journal of Wuhan University of Technology (Transportation Science & Engineering), 2008, 32(2): 351-353.
[2]余勁,張瑋,姜繼紅,等.西江航道船舶流的概率分布特性[J].交通運輸工程學(xué)報,2006,6(2):88-93.
YU Jin, ZHANG Wei, JIANG Jihong, et al. Probability distribution of vessel traffic flow in Xijiang waterway[J].Journal of Traffic and Transportation Engineering, 2006,6(2):88-93.
[3]張矢宇,楊宇昊,陳塵,等.基于回歸-卡爾曼濾波組合模型的航道整治區(qū)域船舶交通流時空預(yù)測[J].大連海事大學(xué)學(xué)? 報,2021,47(1):37-44.
ZHANG Shiyu, YANG Yuhao, CHEN Chen, et al. Spatio-temporal prediction of ship traffic flow in waterway regulation area based on regression-Kalman filter combination model[J]. Journal of Dalian Maritime University, 2021,47(1):37-44.
[4]高廣旭,劉敬賢,劉奕,等.基于矩陣分解的船舶交通流預(yù)測方法研究[J].武漢理工大學(xué)學(xué)報(交通科學(xué)與工程 版),2022,46(1):171-176.
GAO Guangxu, LIU Jingxian, LIU Yi, et al. Research on ship traffic flow prediction method based on matrix factorization[J]. Journal of of Wuhan University of Technology (Transportation Science & Engineering), 2022,46(1):171-176.
[5]肖建兵,惠子剛.基于改進PSO-BP神經(jīng)網(wǎng)絡(luò)的船舶交通流預(yù)測分析[J].天津航海,2020(3):48-53.
[6]甘浪雄,張磊,鄒早建,等.基于場方法的船舶交通流分析[J].上海交通大學(xué)學(xué)報,2014,48(4):551-557.
GAN Langxiong, ZHANG Lei, ZOU Zaojian, et al. Analysis of vessel traffic flow based on field method[J].Journal of Shanghai Jiaotong University, 2014,48(4):551-557.
[7]朱玲,江朝抒,陳祝明.KS,χ2檢驗方法的K分布雜波參數(shù)估計研究[J].電子科技大學(xué)學(xué)報,2008,37(增刊):13-15.
ZHU Ling, JIANG Chaoshu, CHEN Zhuming. Parameter estimation study of K-distribution based on the goodness-of-fit test[J].Journal of University of Electronic Science and Technology of China, 2008,37(Suppl.):13-15.
[8]吳中,王雪潔.內(nèi)河航道船舶交通流研究[J].貴州大學(xué)學(xué)報(自然科學(xué)版),2014,31(1):118-122.
WU Zhong, WANG Xuejie. Study of vessel traffic flow in inland waterway[J].Journal of Guizhou University (Natural Sciences), 2014,31(1):118-122.
[9]金輝,劉克中,馬杰,等.基于高斯混合模型的船舶到達規(guī)律研究[J].武漢理工大學(xué)學(xué)報(交通科學(xué)與工程版),2020,44(1): 162-166.
JIN Hui, LIU Kezhong, MA Jie, et al. Research on vessel arrival rules based on Gaussian mixture model[J].Journal of Wuhan University of Technology (Transportation Science & Engineering), 2020,44(1): 162-166.
[10]曹興飛,趙永濤,曹方全,等.基于ARENA的沿海港口航道通過能力仿真研究[J].中國水運(下半月), 2017,17(12): 96-97.
[11]吳兆麟,朱軍.海上交通工程[M].大連:大連海事大學(xué)出版社,2004.
[12]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計[M].5版.北京:高等教育出版社,2020.
[13]廖鵬,張瑋.船閘日到船概率分布參數(shù)估計[J].交通運輸工程學(xué)報,2004,4(2):115-118.
LIAO Peng, ZHANG Wei. Parameter estimation on daily arrival distribution of waterway lock[J].Journal of Traffic and Transportation Engineering, 2004,4(2):115-118.
[14]楊星,王晶堯, 劉克中,等.基于船舶減速的單線航道通航效率評價[J].中國航海,2020,43(1):35-39.
YANG Xing, WANG Jingyao, LIU Kezhong, et al. Evaluation of navigation efficiency of single-lane channel from the angle of reduced ship speed[J].Navigation of China, 2020,43(1):35-39.
[15]廖鵬.內(nèi)河船舶交通流量的時空分布特征[J].水利水運工程學(xué)報,2009(2):33-38.
LIAO Peng. Temporal and spatial distribution of traffic flow in inland waterways[J].Hydro-Science and Engineering, 2009(2):33-38.
[16]YU Jingjing, TANG Guolei, SONG Xiangqun,et al. Ship arrival prediction and its value on daily container terminal operation[J].Ocean Engineering,2018(157):73-86.
[17]劉釗,崔瓏獻,李巖,等.基于二維矩陣分解的船舶交通流預(yù)測[J].中國航海,2021,44(3):76-83.
LIU Zhao, CUI Longxian, LI Yan, et al. Ship traffic flow prediction with bidimensional matrix mode decomposition[J].Navigation of China, 2021,44(3):76-83.
[18]梅妍玭,張得才,傅榮.一種準(zhǔn)確預(yù)測船舶交通流的自適應(yīng)遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型研究[J].電子器件,2020, 43(2): 452-455.
MEI Yanpin, ZHANG Decai, FU Rong. A BP neural network model for adaptive genetic algorithm optimization for predicting ship traffic flow[J].Chinese Journal of Electron Devices, 2020, 43(2): 452-455.
[19]馮宏祥,肖英杰,孔凡邨.基于支持向量機的船舶交通流量預(yù)測模型[J].中國航海,2011,34(4):62-66.
FENG Hongxiang, XIAO Yingjie, KONG Fancun. Study of vessel traffic forecasting model based on support vector machine[J].Navigation of China, 2011,34(4):62-66.
[20]劉釗,劉敬賢,周鋒,等.船舶交通流行為特征及其在海上交通組織中的應(yīng)用[J].大連海事大學(xué)學(xué)報,2014,40(2):22-26.
LIU Zhao, LIU Jingxian, ZHOU Feng, et al. Behavior characteristics of vessel traffic flow and its realization in marine traffic organization[J].Journal of Dalian Maritime University, 2014,40(2):22-26.
[21]吳康,汪洋,謝磊,等.基于狀態(tài)空間的連續(xù)斷面船舶交通流量預(yù)測研究[J].交通信息與安全,2015(2):51-56.
WU Kang, WANG Yang, XIE Lei, et al. A study of vessel traffic flow forecast based on state space analysis of continuous cross sections[J].Journal of Transport Information and Safety,2015(2):51-56.
[22]王群朋,范天佑.基于SPSS和多元線性回歸的船舶交通流分布擬合研究[J].廣州航海學(xué)院學(xué)報, 2018,26(2):29-32.
WANG Qunpeng, FAN Tianyou. Distribution fitting of vessel traffic flow based on SPSS and multivariate linear regression[J].Journal of Guangzhou Maritime University, 2018,26(2):29-32.
[23]柯冉絢,胡栩禎,陳毅.基于IWRAP模型的船舶交通流數(shù)據(jù)擬合模型[J].中國航海,2018,41(4):77-82.
KE Ranxuan, HU Xuzhen, CHEN Yi. Ship traffic flow data prosessing for IWRAP[J].Navigation of China, 2018,41(4):77-82.
[24]周薇,許潔,王想實.基于大數(shù)據(jù)分析的船舶交通特征統(tǒng)計分析[J].艦船科學(xué)技術(shù),2019,41(4A):82-84.
ZHOU Wei, XU Jie, WANG Xiangshi. Statistical analysis of ship traffic characteristics based on big data analysis[J].Ship Science and Technology, 2019,41(4A):82-84.
[25]劉成勇,萬偉強,陳蜀喆,等.基于灰色馬爾科夫模型的船舶交通流預(yù)測[J].中國航海,2018,41(3):95-100.
LIU Chengyong, WAN Weiqiang, CHEN Shuzhe, et al. Prediction of vessel traffic flow based on grey Markov model[J].Navigation of China, 2018,41(3):95-100.
Statistical characteristics of vessel flow in VTS reports in Yangshan Port
LIU Chao
Department of Navgation,Anhui Communications Vocational & Technical College,Hefei 230051,China
Abstract:In order to analyze the characteristics and operation rules of ship flow in a certain water area, and research quantitatively the rules of ship flow to the port, and provide data support for port operation and vessel traffic services (VTS), parameter estimation of ship arrival from the perspective of optimal fitting based on the K-S test and χ2test of moment estimation theory is carried out, taking 1387 consecutive VTS measured ship flow records in Yangshan Port water area in 66 days in 2020 as the statistical samples. The results show that the ship flow samples reported by VTS in Yangshan Port waters in August and September obey Normal distribution, while the samples in July do not obey Poisson distribution and Normal distribution, which proves that the distribution characteristics of ship flow change significantly with environmental and time factors, and only Poisson distribution or Normal distribution can′t fully describe the characteristics of traffic flow in waters. The relevant research conclusions can provide reference for the analysis of ship flow characteristics, navigation scheduling and other related research.
Keywords:normal distribution; Poisson distribution;K-S test;χ2test;ship flow
(責(zé)任編輯:王惠)