摘要:船舶貨物自動識別高精度數(shù)據(jù)獲取難,影響檢測性能。該文利用弱監(jiān)督至全監(jiān)督框架,結(jié)合改進(jìn)算法構(gòu)建組合框架,平均識別精度達(dá)32.0%,定位精度達(dá)73.8%,高于對比方法。該框架在弱監(jiān)督環(huán)境下表現(xiàn)優(yōu)異,適用于船舶貨物自動識別。
關(guān)鍵詞:YOLOv3;弱監(jiān)督;船舶運(yùn)載;候選區(qū)域
doi:10.3969/J.ISSN.1672-7274.2024.09.001
中圖分類號:TP 391.41 文獻(xiàn)標(biāo)志碼:A 文章編碼:1672-7274(2024)09-000-03
Research on Automatic Identification of Ship Cargo Based on Improved YOLOv3 Object Detection Algorithm
HOU Guojiao1, SUN Rong1, XIAO Shengkui1, LI Wen1, ZHANG Dong2
(1. The Navigation Authority of Yangtze Gorges, Yichang 443002, China;
2. Hunan Tianxiakuan Information Technology Co., Ltd., Changsha 410000, China)
Abstract: The difficulty in obtaining high-precision data for automatic identification of ship cargo affects the detection performance. This study utilizes a weak supervision to full supervision framework combined with improved algorithms to construct a combined framework. The average recognition accuracy reaches 32.0%, and the positioning accuracy reaches 73.8%, which is higher than the comparison methods. This framework performs excellently in a weak supervision environment and is suitable for automatic identification of ship cargo.
Keywords: YOLOv3; weak supervision; ship transportation; candidate region
0 引言
在船舶貨物自動識別領(lǐng)域,視覺圖像的檢測識別扮演著核心角色,而人工智能算法的興起為此提供了新的思路[1]。隨著技術(shù)革新,目標(biāo)檢測算法已廣泛應(yīng)用于船運(yùn)調(diào)度系統(tǒng),顯著減少了貨物分揀與調(diào)度的時(shí)間與誤差,實(shí)現(xiàn)了高效智能化與自動化處理[2]。在眾多算法中,基于監(jiān)督學(xué)習(xí)的目標(biāo)檢測算法逐漸成為航運(yùn)調(diào)度的主流技術(shù)。盡管現(xiàn)有監(jiān)督學(xué)習(xí)方法在多種船舶調(diào)度場景中表現(xiàn)出色,但構(gòu)建高精度、全監(jiān)督特征的檢測模型仍需大量帶有真實(shí)框架和分類標(biāo)記的樣本[3-4]。雙階段方法雖有效,但實(shí)際應(yīng)用復(fù)雜且耗時(shí)低效,而單階段方法,如YOLO系列算法,則較好地解決了這一問題[5-6]。
1 基于改進(jìn)YOLOv3與PGE-L算法的船舶運(yùn)載貨物自動識別分析
1.1 基于PGE-L算法的候選區(qū)域生成研究
為解決航運(yùn)船舶運(yùn)載貨物自動識別的高精度數(shù)據(jù)集獲取困難問題,本文采用弱監(jiān)督到全監(jiān)督的基準(zhǔn)框架,結(jié)合改進(jìn)候選域算法和改進(jìn)YOLOv3形成組合框架,實(shí)現(xiàn)船舶運(yùn)載貨物自動識別??紤]到實(shí)際的航運(yùn)調(diào)度運(yùn)用場景,將弱監(jiān)督到全監(jiān)督(Weak Supervision to Full Supervision,W2F)架構(gòu)作為實(shí)際分析的基線,其架構(gòu)整體流程示意圖如圖1所示。
在圖1中,整體流程始于輸入已標(biāo)注的圖像等級示例數(shù)據(jù)。隨后,將弱監(jiān)督深度神經(jīng)網(wǎng)絡(luò)(WSDNN)與在線實(shí)例分類器優(yōu)化(OICR)策略相結(jié)合,生成多尺度候選域,并通過有標(biāo)簽的圖像樣本進(jìn)行訓(xùn)練。為解決緊包框分?jǐn)?shù)過低導(dǎo)致學(xué)習(xí)方向偏差的問題,引入了PGE算法。該算法生成的緊包框被用作偽標(biāo)簽,進(jìn)而僅需將這些緊包框送入強(qiáng)監(jiān)督檢測器進(jìn)行訓(xùn)練。在兩級監(jiān)督目標(biāo)檢測階段,利用區(qū)域建議網(wǎng)絡(luò)(RPN)進(jìn)行進(jìn)一步篩選,此過程依據(jù)偽地面實(shí)況改編算法(PGA)針對PGE算法傳遞的候選域進(jìn)行,并對模型進(jìn)行訓(xùn)練。針對PGE算法在交疊目標(biāo)探測上的不足,研究進(jìn)行了改進(jìn),提出了PGE-L算法。該改進(jìn)主要針對現(xiàn)有非極大抑制算法及其變體受交并比值限制的問題,通過計(jì)算L值來替代交并比值,衡量候選域間的交并位置信息。L值通過評估兩個(gè)候選域間的相似度來確定其實(shí)際的交并情況,從而提升了算法在交疊目標(biāo)探測上的準(zhǔn)確性。因此,假定存在兩個(gè)候選域,則其實(shí)際位置信息左上角與右下角的相關(guān)坐標(biāo)表達(dá)如式(1)所示。
(1)
式中,和分別表示兩個(gè)候選域;、和、分別表示候選域和左上角的橫縱坐標(biāo);、和、為右下角的橫縱坐標(biāo)。L值的計(jì)算表達(dá)如式(2)所示。
(2)
式中,表示兩個(gè)候選域的L值,即L1范數(shù)。原始信息標(biāo)準(zhǔn)化處理表達(dá)如式(3)所示。
(3)
式中,表示標(biāo)準(zhǔn)化處理后的值;表示原始數(shù)據(jù)量。相應(yīng)轉(zhuǎn)換函數(shù)表達(dá)如式(4)所示。
(4)
式中,表示附加L值的權(quán)重分?jǐn)?shù);表示分類置信度。在PGE-L算法的工作流程中,首先使用L算法替代非極大抑制,不依賴交并比,并在緊包框產(chǎn)生時(shí)立即刪除。在沒有緊包框的條件下,使用PGE算法的步驟,通過循環(huán)迭代合并較大區(qū)別框,作為目標(biāo)的最小外包矩形框架。
1.2 改進(jìn)YOLOv3結(jié)合PGE-L算法的RPY框架分析
在PGE-L算法的基礎(chǔ)上,本文利用注意力機(jī)制來對弱監(jiān)督檢測器進(jìn)行優(yōu)化設(shè)計(jì),以此構(gòu)建一種無須進(jìn)行相關(guān)預(yù)訓(xùn)練的用于弱監(jiān)督檢測的在線特征提取方法,本文將其命名為Rre-Attention。同時(shí),將其與PGE-L算法和改進(jìn)的YLOLv3模型進(jìn)行組合,由此構(gòu)成RPY框架。研究通過利用引入注意力分塊的方法,使模型只保留被關(guān)注對象的所有有價(jià)值的信息,從而實(shí)現(xiàn)對網(wǎng)絡(luò)資源的合理配置并提高模型的性能,進(jìn)而使弱監(jiān)督檢測器更高效地實(shí)現(xiàn)對整個(gè)目標(biāo)的檢測。改進(jìn)后的弱監(jiān)督檢測器模型的架構(gòu)如圖2所示。
從圖2可知,改進(jìn)后的弱監(jiān)督檢測器模型巧妙地引入了提示注意機(jī)制,該機(jī)制運(yùn)用選擇性檢索策略生成候選點(diǎn),并整合關(guān)注區(qū)域(ROI)與增強(qiáng)特性圖,進(jìn)而導(dǎo)出ROI特征圖。此模型還融合了引導(dǎo)注意力分塊與ROI池化后的特征圖,以提煉ROI特征。同時(shí),模型摒棄了原有的回歸分支,避免了對多個(gè)實(shí)例性分支的優(yōu)化,轉(zhuǎn)而采用PGE-L算法對候選區(qū)域進(jìn)行精細(xì)調(diào)整與過濾。本文選用YOLOv3作為強(qiáng)監(jiān)督檢測器,并輔以PGA算法進(jìn)行微調(diào),旨在提升目標(biāo)檢測的精度。在航運(yùn)調(diào)度系統(tǒng)中,模型首先利用Rre-Attention生成圖像級候選點(diǎn),再經(jīng)PGE-L算法過濾,得到緊包框作為實(shí)際對象標(biāo)記,從而實(shí)現(xiàn)高效、精準(zhǔn)的貨物識別與處理。
2 RPY框架在船舶運(yùn)載貨物自動識別中的實(shí)驗(yàn)分析
2.1 RPY框架各部分實(shí)驗(yàn)驗(yàn)證
為了驗(yàn)證RPY框架的有效性,本文對每個(gè)模塊進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)中選擇數(shù)據(jù)對象類2007/2012(Visual Object Classes,VOC 2007/2012)兩個(gè)數(shù)據(jù)集(分別命名為數(shù)據(jù)集1和數(shù)據(jù)集2)。數(shù)據(jù)集1選擇5 000張圖片作為訓(xùn)練集,數(shù)據(jù)集2選擇11 000張圖片作為訓(xùn)練集,而評價(jià)指標(biāo)選擇全類平均精確度(mean Average Precision,mAP)和平均定位準(zhǔn)確率(CorLoc)。其中,在引導(dǎo)注意力機(jī)制的影響分析實(shí)驗(yàn)中,將引入引導(dǎo)注意力機(jī)制的相關(guān)弱監(jiān)督檢測模塊設(shè)定為G,其結(jié)果如圖3所示。
圖3中,1~9分別表示數(shù)據(jù)集中的不同圖片。數(shù)據(jù)集1中G模塊所有圖片中最高識別檢測準(zhǔn)確率為47.0%,最低準(zhǔn)確率為13.9%,而mAP值為32.0%,相對于W2F來說實(shí)際性能增加了1.6%,相對于OICR來講實(shí)際性能增加了3.1%。而在CorLoc對比中,G模塊的CorLoc值達(dá)到55.9%,顯著高于OICR的51.1%和W2F的53.5%。在數(shù)據(jù)集2中G模塊的mAP值和CorLoc值分別為34.2%和56.7%,均高于對比模塊。研究引入的G模塊對于航運(yùn)調(diào)度系統(tǒng)而言基本達(dá)到實(shí)際滿意程度。PGE-L算法不僅篩選精度優(yōu)于PGE,而且在實(shí)際的篩選速度上也顯著優(yōu)于PGE,表明其具備有效性。強(qiáng)監(jiān)督檢測器的影響分析結(jié)果如圖4所示。
圖4中,數(shù)據(jù)集1中YOLOv3-PGA模塊后的RPY框架的mAP值為53.7%,高于使用YOLOv3模塊的框架的43.2%和采用快速循環(huán)神經(jīng)網(wǎng)絡(luò)(Faster Recurrent Neural Network,F(xiàn)aster R-CNN)的50.5%。其CorLoc值為73.8%,顯著優(yōu)于對比方法的58.6%和65.5%。YOLOv3-PGA模塊對RPY框架的貢獻(xiàn)是十分明顯的,表明了本文對YOLOv3算法進(jìn)行改進(jìn)的做法具備有效性。
2.2 RPY框架整體實(shí)驗(yàn)驗(yàn)證分析
對比模型包含圖中的WSDDN、OICR以及W2F,并額外引入提議集群學(xué)習(xí)(Proposal Cluster Learning,PCL)、弱監(jiān)督定位的上下文感知深度網(wǎng)絡(luò)模型(Context-Awar-e Deep Network Models for Weakly Supervised Localization,ContextLocNet)以及弱監(jiān)督級聯(lián)卷積網(wǎng)絡(luò)模型(Weakly Supervised Cascaded Convolutional Networks,WCNN),將mAP值設(shè)定為a~f,RPY設(shè)定為g。不同模型的mAP值對比結(jié)果如圖5所示。
圖5中,數(shù)據(jù)集1中研究提出的RPY的mAP值為53.7%。數(shù)據(jù)集2中RPY的mAP值為49.5%。W2F和RPY均是從弱監(jiān)督過渡到強(qiáng)監(jiān)督的弱監(jiān)督檢測器,二者的數(shù)值顯著優(yōu)于傳統(tǒng)的相關(guān)弱監(jiān)督檢測模型。因此可以判定從相關(guān)弱監(jiān)督中生成相應(yīng)的偽標(biāo)注并將其輸入強(qiáng)監(jiān)督中,以此來進(jìn)行相應(yīng)回歸的解決思路在理論上是可行且有效的。
3 結(jié)束語
針對當(dāng)前航運(yùn)調(diào)度系統(tǒng)模塊中船舶運(yùn)載貨物自動識別中的高精度數(shù)據(jù)集獲取十分困難的問題,本文利用弱監(jiān)督到全監(jiān)督的基準(zhǔn)框架與改進(jìn)YOLOv3來構(gòu)建了RPY框架。本文構(gòu)建的組合框架在船舶運(yùn)載貨物自動識別中具備有效性和實(shí)用性。
參考文獻(xiàn)
[1] 王婕佳.貿(mào)易便利化對我國跨境電商出口的實(shí)證研究[J].經(jīng)濟(jì)學(xué),2021(4):60-63.
[2] Cheah L, Huang Q. Comparative carbon footprint assessment of cross-border e-commerce shipping options[J]. Transportation Research Record, 2022(1): 584-595.
[3] 周凌翱.基于ARM的高精度船舶恒溫運(yùn)輸系統(tǒng)[J].艦船科學(xué)技術(shù), 2022(13):162-165.
[4] 范曉飚,衛(wèi)澤亮,程志友,等.基于AHP的龍門吊船裝卸貨物作業(yè)安全風(fēng)險(xiǎn)分析[J].重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版), 2022(3):143-148.
[5] 黎峰,沈立寧,李健,等.散貨船快速改裝運(yùn)載集裝箱的系固設(shè)計(jì)及應(yīng)用[J].船海工程, 2023(1):30-35.
[6] 許偉,熊衛(wèi)華.一種改進(jìn)的輕量級垃圾目標(biāo)檢測算法[J].計(jì)算機(jī)技術(shù)與發(fā)展, 2022(2):63-68.