湯先峰,張勝茂,樊 偉,裴凱洋
(1.中國水產(chǎn)科學(xué)研究院東海水產(chǎn)研究所,農(nóng)業(yè)農(nóng)村部東海漁業(yè)資源開發(fā)利用重點實驗室,上海 200090;2.上海海洋大學(xué)信息學(xué)院,上海 201306)
我國漁船擁有量大,據(jù)2018中國漁業(yè)統(tǒng)計年鑒[1]報道,我國近海機動捕撈漁船超17萬艘,作為典型近海捕撈作業(yè)方式的刺網(wǎng)和拖網(wǎng)捕撈漁船數(shù)占總船數(shù)的72.6%。目前捕撈漁船需提前申請捕撈許可證并登記作業(yè)類型,但實際作業(yè)過程中可能存在不遵守規(guī)則情況,導(dǎo)致網(wǎng)具使用比較混亂。違規(guī)作業(yè)會對漁業(yè)資源和海洋生態(tài)環(huán)境產(chǎn)生不利影響,因此準(zhǔn)確的漁船作業(yè)識別可為漁船的有效管理帶來幫助。
國內(nèi)外對于漁船作業(yè)監(jiān)控,主要有以下3種手段:傳統(tǒng)現(xiàn)場監(jiān)測、基于衛(wèi)星遙感技術(shù)的漁船作業(yè)監(jiān)測和基于漁船監(jiān)控系統(tǒng)(vessel monitoring system,VMS)的漁船作業(yè)監(jiān)測。傳統(tǒng)的海上巡邏和登臨檢查準(zhǔn)確度高,但監(jiān)控難度大、成本高、風(fēng)險高、檢查數(shù)量有限,在管理上存在局限性?;谛l(wèi)星遙感技術(shù)的漁船監(jiān)測更多是對燈光作業(yè)漁船(燈光圍網(wǎng)、秋刀魚舷提網(wǎng)、魷魚釣和燈光罩網(wǎng))進行監(jiān)測[2],監(jiān)測面較窄,并且遙感影像易受云層的干擾。而VMS能實時記錄漁船的經(jīng)度、緯度、航速、航向、發(fā)報時間等數(shù)據(jù)[3-4],可以快速獲取大范圍漁船作業(yè)信息[5-6],監(jiān)控系統(tǒng)的船舶定位技術(shù)已經(jīng)比較成熟, 從定位方式來看, 主要有北斗漁船定位、沿海CDMA網(wǎng)絡(luò)定位、AIS船舶定位[7]等。以往利用VMS對漁船作業(yè)的監(jiān)測多集中于對已知作業(yè)類型漁船不同捕撈作業(yè)階段的識別,即區(qū)分同種類型漁船捕撈和非捕撈作業(yè)階段;識別算法多集中于設(shè)置船速或航向閾值、統(tǒng)計推斷、機器學(xué)習(xí)方法等[8-10],此種方法大部分用來計算捕魚有關(guān)的指標(biāo),例如捕撈努力量[11]等,難以對未知(即未登記)作業(yè)類型的漁船進行監(jiān)測。以上幾種監(jiān)測方式和監(jiān)測算法都存在一定的局限性。目前國內(nèi)外已有研究將漁船作業(yè)識別監(jiān)測的重點轉(zhuǎn)移至對漁船軌跡的研究,識別方法多是基于深度學(xué)習(xí)、機器學(xué)習(xí)等:HUANG等[12]利用XGBoost的特征工程和機器學(xué)習(xí)算法作為其兩個關(guān)鍵模塊構(gòu)建了VMS漁船軌跡識別方案,對8種不同的漁船作業(yè)方式進行了監(jiān)測識別;DE SOUZA等[13]針對拖網(wǎng)、延繩釣和圍網(wǎng)漁船分別開發(fā)了不同的機器學(xué)習(xí)算法進行識別;KROODSMA等[14]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)算法將AIS漁船分為7類進行了識別研究[14-15]。
目前深度學(xué)習(xí)方法發(fā)展迅速[15],可以將特征工程自動化,相比HUANG等[12]和DE SOUZA等[13]使用的機器學(xué)習(xí)方法,CNN無須研究手動設(shè)計特征。目前利用CNN算法對北斗VMS漁船軌跡數(shù)據(jù)進行監(jiān)測的研究較少,本文提出一種利用CNN對刺網(wǎng)和拖網(wǎng)漁船軌跡進行識別分類的方法:首先利用航次提取方法提取出每艘漁船具體的航次信息,根據(jù)提取的航次信息將原始VMS數(shù)據(jù)進行劃分,根據(jù)每個劃分的數(shù)據(jù)里的經(jīng)緯度點數(shù)據(jù),批量畫出每個航次的軌跡點圖,以此生成刺網(wǎng)和拖網(wǎng)航跡圖庫;將刺網(wǎng)和拖網(wǎng)航跡圖輸入到深度卷積神經(jīng)網(wǎng)絡(luò)模型中,根據(jù)大量的圖片訓(xùn)練、學(xué)習(xí)和驗證,以此得到區(qū)分拖網(wǎng)作業(yè)和刺網(wǎng)作業(yè)的深度學(xué)習(xí)模型。
研究實驗整體流程如圖1所示。
刺網(wǎng)和拖網(wǎng)的北斗船位數(shù)據(jù)來源于北斗民用分理服務(wù)商,北斗VMS數(shù)據(jù)信息主要包括漁船的ID、經(jīng)緯度、時間等信息,空間分辨率約為 10 m,時間分辨率約為 3 min。研究使用浙江省北斗VMS 2017年數(shù)據(jù),其中包括刺網(wǎng)作業(yè)船1 566艘,拖網(wǎng)作業(yè)船2 504艘,漁船作業(yè)類型均為登記作業(yè)類型。根據(jù)本文航次圖生成方法共生成刺網(wǎng)航跡作業(yè)圖11 912張,拖網(wǎng)航跡圖11 488張。
1.3.1 航次劃分方法
航次是漁業(yè)生產(chǎn)管理中常用的統(tǒng)計量,漁船按照約定的捕撈計劃從出發(fā)港到返回港為一個航次。漁船出海作業(yè)過程中,船載北斗終端發(fā)送漁船ID、船位經(jīng)緯度、時間等信息,位置點記錄的時間間隔約為3 min,每個航次由一系列時間序列船位點組成。首先按0.1°×0.1°把中國海岸線劃分到每個格網(wǎng)中,生成格網(wǎng)信息圖層,然后將格網(wǎng)圖層與海岸線圖層疊加,兩者相交的格網(wǎng)即為港口格網(wǎng),將省、地區(qū)、縣行政區(qū)劃圖層與港口格網(wǎng)中心點圖層疊加,計算出港口格網(wǎng)中心點經(jīng)度和緯度,格網(wǎng)所屬的行政區(qū)劃為離中心點最近的行政區(qū)劃。將漁船軌跡線與港口格網(wǎng)相疊加,相交的點即為漁船的出發(fā)港和返回港,根據(jù)出發(fā)港船位點和返回港船位點來提取出具體的每個航次信息[16]。
圖1 研究實驗流程圖Fig.1 Research experiment flow chart
圖2為漁船航次示意圖,格網(wǎng)中心點為港口。圖2中有2個航次,分別是航次1和航次2。航次1從港口格網(wǎng)A出發(fā),經(jīng)過海上捕撈作業(yè),在港口格網(wǎng)C返港;航次2從港口格網(wǎng)D出發(fā),經(jīng)過海上捕撈作業(yè),在港口格網(wǎng)D返港。
圖2 漁船航次示意圖Fig.2 Schematic diagram of fishing boat voyage
1.3.2 航跡圖生成方法
根據(jù)提取的每個2017年浙江省北斗VMS拖網(wǎng)和刺網(wǎng)所有航次信息,將原始VMS數(shù)據(jù)劃分為每個航次數(shù)據(jù);根據(jù)每個航次數(shù)據(jù)里的經(jīng)緯度數(shù)據(jù),依次生成每個航次的航跡圖。航跡圖生成流程如圖3所示(圖中為拖網(wǎng)航跡圖生成流程示例,流程圖中使用的航次和船位數(shù)據(jù)圖片不代表最終使用的數(shù)據(jù),僅提供數(shù)據(jù)格式和過程示意),航跡圖為每個航次的所有船位經(jīng)緯度點的軌跡點圖。將不清晰、數(shù)據(jù)點太少和航次不完整的圖人工觀察剔除掉,共生成刺網(wǎng)航跡圖11 912張,拖網(wǎng)航跡圖11 488張,圖片高×寬為288像素×432像素(以下統(tǒng)一簡寫為432×288),以此形成拖網(wǎng)和刺網(wǎng)的航跡圖數(shù)據(jù)庫。
CNN通過監(jiān)督學(xué)習(xí),能夠直接從原始圖像中識別出圖像特征[17-18]。CNN[19]模型一般由卷積層、池化層、全連接層、Softmax分類層等堆疊組成[20],可根據(jù)需要自定義不同層的結(jié)構(gòu)和組成。卷積操作用于特征提取,卷積核相當(dāng)于一個過濾器,提取我們需要的特征。卷積運算具體公式如下:
式中,m的取值范圍為(0,m),n的取值范圍為(0,n),i、j為卷積核w的尺寸;f為激活函數(shù);b為附加偏執(zhí)量;Yconv為其輸出。
池化層 (pooling)可以看作是模糊濾波器, 起到二次特征提取的作用,其中最常用的是最大池化(maxpooling)。最大池化具體公式如下:
fpool=Max(xm,n,xm+1,n,xm,n+1,xm+1,n+1)
圖3 航跡圖生成流程示意圖Fig.3 Schematic diagram of fishing boat voyage track
fpool為最大池化后的結(jié)果。
ReLU 激活函數(shù)能夠加快大型網(wǎng)絡(luò)訓(xùn)練速度,并且為常見框架提供了實現(xiàn)方案,使用非常便捷[21]。模型所選擇的激活函數(shù)基本上都是 ReLU 激活函數(shù),其函數(shù)表達式為:
f(x)=max(0,x)
在全連接層之前,卷積神經(jīng)網(wǎng)絡(luò)卷積層和池化層所提取的特征仍處于局部抽取的層面,要想正確分類, 必須將局部信息進行展開,因此在最后一個池化層之后緊接一個全連接層,將池化層的特征綜合起來并利用Softmax分類器進行分類[22]。Softmax函數(shù)表達式為:
Softmax函數(shù)類似于概率分布,輸出結(jié)果總和為 1,每個節(jié)點得到的結(jié)果代表某種可能性概率[21]。
構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和方法非常多,不同的網(wǎng)絡(luò)模型在公開數(shù)據(jù)集以外的圖片分類任務(wù)中表現(xiàn)并不一定相同,模型中可對比的參數(shù)和調(diào)整的地方也非常多,不同的結(jié)構(gòu)設(shè)計和方法選擇會影響分類的效果,本文選擇使用網(wǎng)絡(luò)結(jié)構(gòu)比較復(fù)雜的VGG-16模型與相對簡單的自定義10層CNN模型作實驗,同時僅對圖片輸入大小做篩選實驗。
2.1.1 自定義的10層CNN結(jié)構(gòu)
自定義的10層CNN網(wǎng)絡(luò)由3個卷積層、兩個池化層(maxpooling層)、兩個dropout層、一個flatten層、兩個全連接分類層(dense層和softmax層)組成。其中卷積層均采用 3×3 的卷積運算,前兩個卷積層的核數(shù)量均為32,第三個卷積層的核數(shù)量為64;池化層均采用2×2 的卷積運算,第一個池化層卷積核數(shù)量均為32,第二個池化層的卷積核數(shù)量為64。為防止過擬合,模型采用 dropout 正則化。本文選擇添加速率值等于0.5 的 dropout層用以防止過擬合,最后使用2標(biāo)簽softmax分類層,自定義CNN網(wǎng)絡(luò)結(jié)構(gòu)見圖4所示。
圖4 自定義CNN模型結(jié)構(gòu)示意圖Fig.4 Schematic diagram self-defined CNN
2.1.2 調(diào)整后的VGG-16結(jié)構(gòu)
遷移學(xué)習(xí)即將網(wǎng)絡(luò)中每個節(jié)點的權(quán)重從一個訓(xùn)練好的網(wǎng)絡(luò)遷移到一個全新的網(wǎng)絡(luò)里,VGG-16網(wǎng)絡(luò)權(quán)重由ImageNet訓(xùn)練而來,具備較強的深度特征學(xué)習(xí)能力[23]。本文研究的數(shù)據(jù)集較小,數(shù)據(jù)跟ImageNet數(shù)據(jù)相似度不高,為使VGG-16更符合本文數(shù)據(jù)要求,又避免訓(xùn)練整個網(wǎng)絡(luò),減少網(wǎng)絡(luò)訓(xùn)練時間和提高網(wǎng)絡(luò)訓(xùn)練效率,研究使用遷移學(xué)習(xí)和模型微調(diào)的方法,在編譯和訓(xùn)練模型之前將網(wǎng)絡(luò)凍結(jié)第二層到最后一層,同時重新定義密集連接分類器,用2標(biāo)簽Softplus分類器替換原有的Softmax分類層,最后使用Adam優(yōu)化器優(yōu)化網(wǎng)絡(luò)。調(diào)整后的VGG-16刺網(wǎng)和拖網(wǎng)航跡圖識別流程框架如圖5所示。
根據(jù)1.3.2航跡圖生成方法生成拖網(wǎng)和刺網(wǎng)航跡圖。圖6~圖7為刺網(wǎng)和拖網(wǎng)航跡作業(yè)軌跡示意圖。
圖片在訓(xùn)練前首先會把每張圖片的每個像素值乘以放縮因子1/255,把像素值放縮到0和1之間,將所有的圖片統(tǒng)一歸一化為模型指定大小(圖8中的示意圖已統(tǒng)一處理成224×224大小);因數(shù)據(jù)集較小,實驗利用Keras的內(nèi)置ImageDataGenerator圖像增廣技術(shù)在模型訓(xùn)練時來隨機擴充數(shù)據(jù)集。本文在不影響圖片語義的基礎(chǔ)上選擇2種方式對數(shù)據(jù)集擴充:1)將圖片進行錯切變換,即讓點的x坐標(biāo)(或者y坐標(biāo))保持不變,而對應(yīng)的y坐標(biāo)(或者x坐標(biāo))則按比例發(fā)生平移,且平移的大小和該點到x軸(或y軸)的垂直距離成正比,錯切變化系數(shù)設(shè)置為0.2;2)將圖片隨機放縮到寬/高×(0.8~1.2)范圍內(nèi);通過以上操作實現(xiàn)對圖像的增廣。圖8為同一張圖片進行以上操作效果圖。
圖5 VGG-16刺網(wǎng)和拖網(wǎng)航跡圖識別框架Fig.5 VGG-16 gill and trawl track picture identification frame
圖6 刺網(wǎng)航跡圖 Fig.6 Gill track 注:a、b、c:定置刺網(wǎng);d、e、f:流刺網(wǎng)Note:a, b, c: set gillnet ;d, e, f: drift gillnet
圖7 拖網(wǎng)軌跡圖Fig.7 Trawl track注:a、b、c: 拖網(wǎng)Note:a, b, c: trawl net
實驗在ubuntu16.04操作系統(tǒng)下搭建Keras框架進行,使用NVIDIA Tesla v100加速訓(xùn)練網(wǎng)絡(luò)。將數(shù)據(jù)集劃分為訓(xùn)練集和驗證集,訓(xùn)練集由刺網(wǎng)9 999張航跡圖、拖網(wǎng)9 436張航跡圖組成;驗證集由刺網(wǎng)1 911張航跡圖、拖網(wǎng)2 142張航跡圖組成,在訓(xùn)練集上訓(xùn)練模型,在驗證集上評估模型。本文的實驗過程順序為:1)對輸入圖片大小進行選??;2)對自定義的10層CNN和調(diào)整過后的VGG-16做比較,選取較優(yōu)的模型;3)增大輪次epoch(即訓(xùn)練的輪數(shù)),觀察模型能達到的精度是多少,即模型在迭代多少輪可以達到最優(yōu)的精度。因輪數(shù)(epoch)設(shè)置過大訓(xùn)練時間太長,并且模型初實驗在第10輪左右時就已經(jīng)達到87%的準(zhǔn)確率,故在實驗1)、2)步驟中將epoch設(shè)置為100,確定模型結(jié)構(gòu)和圖片輸入大小后,再將epoch調(diào)大觀察。
圖8 圖片增廣操作效果圖 Fig.8 effect picture after image augmentation 注:a. 432×288原圖歸一化為224×224效果圖; b. 歸一化為224×224的圖片進行系數(shù)為0.2的錯切變換; c. 歸一化為224×224的圖片進行系數(shù)為0.2的放縮Note: a. original 432×288 picture normalized to 224×224; b. 224×224 picture after shear transformation by coefficient 0.2; c. 224×224 picture after zoom by coefficient 0.2
首先對輸入圖片大小進行選取,分別對輸入圖片大小為150×150、224×224和438×288的數(shù)據(jù)集進行迭代100輪,統(tǒng)一使用上述調(diào)整后的VGG-16網(wǎng)絡(luò),模型訓(xùn)練采用批處理方式,batch大小設(shè)置為32,不同輸入圖片大小的訓(xùn)練集精度和損失性能如圖9所示。不同的輸入圖片大小在訓(xùn)練集的表現(xiàn)有一定的差距,根據(jù)精度和損失變化(圖9),可以認(rèn)為224×224大小的圖片整體上比其他兩種大小的圖片訓(xùn)練精度要高,并且在剛開始迭代時就能達到比較高的精度。因此實驗把輸入圖片的大小確定為224×224。
本研究涉及的兩種模型中,CNN剛開始迭代精度比VGG-16低,第10輪左右開始CNN的精度要高于VGG-16,在模型損失上也呈現(xiàn)出相同的情況(圖10)。本文設(shè)計的CNN和調(diào)整過的VGG-16相比,自定義的CNN精度要高于調(diào)整后的VGG-16,CNN模型迭代100輪最終的精度為94.07%。故實驗最終選擇自定義的10層CNN模型。
圖9 不同圖片大小訓(xùn)練集精度和損失Fig.9 Train accuracy and loss of different input image sizes
圖10 VGG-16和自定義CNN訓(xùn)練集精度和損失對比Fig.10 Accuracy and loss comparison of train data between VGG-16 and self-defined CNN
在一定程度上,迭代次數(shù)越多,模型的訓(xùn)練集精度越高(圖11),超過80輪左右,模型驗證集的精度不再繼續(xù)提高,損失也開始上升(圖12),所以模型迭代80次便可以停止,迭代80次自定義的10層CNN模型訓(xùn)練集最終的精度為94.3%,驗證集最終精度為93.6%。
刺網(wǎng)大體可分為流刺網(wǎng)和定置刺網(wǎng)。圖6 中(a)(b)(c)為定置刺網(wǎng),(d)(e)(f)為流刺網(wǎng)。流刺網(wǎng)作業(yè)一般先是航行,作業(yè)區(qū)域軌跡點比較筆直,圖中表現(xiàn)為一段黑且直的直線,放大后可以看到直線的端點有個密集的點。定置刺網(wǎng)和流刺網(wǎng)軌跡點圖的區(qū)別為:定制刺網(wǎng)作業(yè)區(qū)域的軌跡線條一般比流刺網(wǎng)直,直線段更密和黑,放大后直線端點大部分沒有密集的點。相比刺網(wǎng)軌跡點圖,拖網(wǎng)的軌跡點圖沒有突出的特征,拖網(wǎng)的軌跡點圖特征可歸結(jié)為:亂、多、密,一般不會形成像刺網(wǎng)一樣簡潔有規(guī)律的線條。
圖11 自定義CNN精度Fig.11 Accuracy of self-defined CNN
圖12 自定義CNN損失Fig.12 Loss of self-defined CNN
以上是刺網(wǎng)和拖網(wǎng)理想的軌跡點圖規(guī)律特點。剔除的圖片如圖13,包含:a) 航次不完整,即航次軌跡點出現(xiàn)斷層;b) 軌跡點過于稀疏混亂不清晰;c) 沒有特征點的軌跡圖。同時結(jié)合以上刺網(wǎng)和拖網(wǎng)的作業(yè)特點,剔除可能證業(yè)不符、存在問題的圖(即登記作業(yè)為拖網(wǎng),圖片明顯為刺網(wǎng);登記作業(yè)為刺網(wǎng),圖片明顯為拖網(wǎng);或明顯既不是刺網(wǎng)也不是拖網(wǎng)的圖)。
關(guān)于數(shù)據(jù)集,可能存在以下幾點影響模型的最終精度:1)漁具使用混雜。存在改變注冊作業(yè)類型的情況,即一艘船在不同的漁汛期使用不同的漁具進行生產(chǎn),不完全按照注冊漁具生產(chǎn),使得訓(xùn)練數(shù)據(jù)中可能存在記錄是刺網(wǎng)或拖網(wǎng)但實際上是其他漁具作業(yè)的情況;2)航次提取存在誤差。航次記錄分為兩種情況,一種是起航、海上作業(yè)、返航過程完整,另一種是航次信息不完整,即只記錄了3個階段的某一、兩個階段。航次不完整的原因主要是北斗衛(wèi)星數(shù)據(jù)受信號干擾、信道占用、供電不足或斷電等影響,導(dǎo)致船位數(shù)據(jù)丟失,或者統(tǒng)計時間段出現(xiàn)一些航次被分割到不同時間段,同時航次提取中數(shù)據(jù)處理不夠精細可能會導(dǎo)致結(jié)果有些誤差[24];3)人為剔除數(shù)據(jù)存在誤差。即批量出圖后需要人為剔除一些質(zhì)量不佳的圖片數(shù)據(jù)。1)和2)中的問題可以根據(jù)人工剔除圖片操作解決,即只選取數(shù)據(jù)質(zhì)量好的航次圖片進行學(xué)習(xí)訓(xùn)練,可能存在有些船位點太少使圖片本身反映不出具體是哪種捕撈作業(yè)的圖片未被剔除,或存在1)和2)中問題的圖片未被剔除,從而混入模型中影響精度。3)中人工剔除圖片操作的誤差很小,基本不影響本文根據(jù)深度學(xué)習(xí)對刺網(wǎng)和拖網(wǎng)作業(yè)分類識別的可行性。
CNN主要的經(jīng)典結(jié)構(gòu)有很多,不同的網(wǎng)絡(luò)在本數(shù)據(jù)集上的表現(xiàn)可能不同,本文僅討論了兩種網(wǎng)絡(luò),可以嘗試研究其他的網(wǎng)絡(luò),對比分析不同網(wǎng)絡(luò)在刺網(wǎng)和拖網(wǎng)分類上的性能。卷積神經(jīng)網(wǎng)絡(luò)中,有大量的預(yù)設(shè)參數(shù),例如卷積層的卷積核大小、卷積核個數(shù)、激活函數(shù)的種類、池化方法的種類、網(wǎng)絡(luò)的層結(jié)構(gòu)等,可以嘗試改變以上參數(shù),如本文自定義的CNN模型可以嘗試增加或減少相應(yīng)的層數(shù)或改變卷積核大小,VGG-16可以嘗試凍結(jié)前k個層,然后重新訓(xùn)練后面的n~k個層等;也可以改變與訓(xùn)練有關(guān)的參數(shù),如batch的大小、學(xué)習(xí)率等,后續(xù)研究可以根據(jù)以上結(jié)果對模型進行優(yōu)化。
捕撈漁船作業(yè)種類較多,分類方式根據(jù)不同的標(biāo)準(zhǔn)也有多種,本文獲得的VMS數(shù)據(jù)將漁船作業(yè)分為了7種,分別是刺網(wǎng)、拖網(wǎng)、張網(wǎng)、圍網(wǎng)、釣具、籠壺和雜漁具。因獲得的數(shù)據(jù)不均,差距較大,對于本文3.2中討論的漁具混雜問題,這7種類型數(shù)據(jù)前期人工處理的難度較高,處理的誤差將會變大,使得訓(xùn)練集誤差增大,同時其他類型船位點特征不如刺網(wǎng)和拖網(wǎng)船位點特征明顯,利用CNN方法能否對所有的漁船作業(yè)類型軌跡圖進行區(qū)分識別還有待進一步研究;刺網(wǎng)和拖網(wǎng)作為典型的捕撈作業(yè)方式,現(xiàn)有的數(shù)據(jù)量大且質(zhì)量較好,后續(xù)可通過細致的處理提高數(shù)據(jù)本身的精度,擴大分類種類,改變?nèi)B接層的分類個數(shù),利用本文實驗的模型對幾種不同的作業(yè)方式進行識別研究。
圖13 剔除的航跡圖示例Fig.13 Eliminated track picture注:a. 船位點過于稀疏混亂; b. 航次不完整; c. 沒有特征點Note: a. sparse and chaotic position points; b. incomplete voyage; c. no characteristic point
本文根據(jù)拖網(wǎng)和刺網(wǎng)北斗VMS數(shù)據(jù)生成了拖網(wǎng)和刺網(wǎng)多個航次的航跡點圖,然后將航跡點圖輸入到自定義的10層CNN模型以及利用遷移學(xué)習(xí)和模型微調(diào)方法調(diào)整后的VGG-16模型中,經(jīng)過對比實驗,自定義的CNN模型精度整體上要高于調(diào)整后的VGG-16模型,最終自定義的10層CNN模型訓(xùn)練集精度為94.3%,驗證集精度為93.6%,證明了本文方法的可行性,使用深度學(xué)習(xí)方法對刺網(wǎng)和拖網(wǎng)VMS航跡點識別分類具有較高的準(zhǔn)確率,為漁船作業(yè)的識別分類提供了新思路,本文僅對兩種作業(yè)類型進行了識別研究,后續(xù)可細致區(qū)分不同作業(yè)類型之間的區(qū)別,提高研究數(shù)據(jù)的準(zhǔn)確度,對所有的作業(yè)類型進行區(qū)分識別。北斗VMS可以大范圍快速的獲取漁船信息,現(xiàn)有的研究并沒有完全挖掘出VMS信息的價值,僅集中于對VMS幾種數(shù)據(jù)進行研究,研究方法尚較固定單一,今后的研究可以改進研究方法和思路,進一步提高數(shù)據(jù)的準(zhǔn)確性,挖掘出VMS數(shù)據(jù)更多有價值的信息,為漁業(yè)發(fā)展提供科學(xué)有效的參考。