国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SSD的橋梁主動防船撞目標檢測方法與應用

2020-04-10 06:54:10夏燁陳李沐王君杰孫利民
湖南大學學報·自然科學版 2020年3期
關鍵詞:目標檢測視頻監(jiān)控神經(jīng)網(wǎng)絡

夏燁 陳李沐 王君杰 孫利民

摘 ? 要:針對現(xiàn)有橋梁主動防撞視頻監(jiān)測系統(tǒng)在精度、魯棒性和效率等方面的局限性,提出基于SSD(Single Shot MultiBox Detector)目標檢測的橋梁主動防撞視頻監(jiān)測系統(tǒng)框架,建立并使用海量船舶圖像數(shù)據(jù)集對SSD模型進行神經(jīng)網(wǎng)絡訓練,生成適用于復雜環(huán)境下的船舶目標檢測模型,通過樣本選取、數(shù)據(jù)增強、廣域劃分優(yōu)化等技術手段,實現(xiàn)航區(qū)船舶目標的穩(wěn)定、智能檢測.與傳統(tǒng)方法相比,提出的船舶目標檢測方法在穩(wěn)定性、準確性、高效性和智能化方面優(yōu)勢明顯.以上海松浦大橋為工程背景進行了實橋試驗,驗證了該方法在橋區(qū)航道長期穩(wěn)定監(jiān)測的可行性,為進一步的航跡跟蹤預測、防撞預警和航道監(jiān)控提供信息支持.

關鍵詞:主動防船撞;視頻監(jiān)控;神經(jīng)網(wǎng)絡;目標檢測;松浦大橋;危險源辨識

中圖分類號:U447 ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標志碼:A

Single Shot MultiBox Detector Based Vessel Detection Method and Application for Active Anti-collision Monitoring

XIA Ye,CHEN Limu,WANG Junjie,SUN Limin?覮

(College of Civil Engineering,Tongji University,Shanghai 200092,China)

Abstract:Single Shot Multibox detector based video surveillance system for active anti-collision between vessel and bridge is proposed aiming at the limitations of the existing systems in accuracy,robustness and efficiency. A vessel-exclusive dataset with tons of image samples is established for neural network training,and an SSD (Single Shot MultiBox Detector) based object detection model with both universality and pertinence is generated with tactics of sample filtering,data augmentation and large-scale optimization,which can realize the stable and intelligent vessel detection. Comparison results with conventional methods indicate that the proposed navigational object detection method shows remarkable advantage in robustness,accuracy,efficiency and intelligence. In-situ test is carried out at Songpu Bridge in Shanghai,and the results illustrate that the method is qualified for long-term monitoring and provides information support for further analysis and decision making.

Key words:active anti-collision,video surveillance,neural networks,object detection,Songpu Bridge,hazard source identification

船撞橋事故在橋梁事故中占比極高,對橋梁公路安全運輸、人民的生命財產(chǎn)乃至社會經(jīng)濟的發(fā)展均造成重大影響.隨著經(jīng)濟持續(xù)增長和對交通設施的需求日益加大,我國橋梁的建設數(shù)目不斷增加,大型橋梁的建設可以緩解交通壓力、促進陸路交通.但是對于水上船舶而言,橋梁卻是人工障礙物,船舶在橋下航行通行時 ,存在著碰撞橋墩或橋跨結構的危險,從而對橋梁、船舶的安全性構成威脅,同時對航道和陸路交通的正常運行也構成威脅.

傳統(tǒng)的橋梁主動防撞一般通過船舶交通管理系統(tǒng)(VTS)、船舶自動識別系統(tǒng)(AIS)建立橋梁船撞預警來引導船舶的航行,通過視頻監(jiān)控系統(tǒng)(CCTV)監(jiān)控橋區(qū)現(xiàn)場情況.VTS、 AIS需要安裝大量昂貴的設備,造價較高,而傳統(tǒng) CCTV又無法實現(xiàn)主動預警的功能.近年來,基于視頻目標檢測的橋梁防船撞主動預警技術受到部分學者的關注和研究,該技術通過將視頻目標檢測結合CCTV,實現(xiàn)對橋區(qū)水域主動預警的功能.然而,現(xiàn)有的橋梁防撞視頻監(jiān)測系統(tǒng)大多采用基于運動的目標檢測技術[1,2],既依賴背景環(huán)境的穩(wěn)定性,又無法對偽目標進行智能甄別,面對復雜多變的航道環(huán)境,其適應性差、智能化程度低的缺點凸顯.

本文提出基于視頻傳感的橋梁主動防船撞監(jiān)測預警系統(tǒng)框架,闡述航區(qū)目標檢測的具體流程和技術方法.相較于傳統(tǒng)基于運動目標檢測方法的監(jiān)測系統(tǒng),深度學習目標檢測方法有潛力改善現(xiàn)有技術,克服現(xiàn)有方法在復雜環(huán)境下的適應性問題和目標的智能識別問題,使得該系統(tǒng)能實現(xiàn)復雜且多變環(huán)境下穩(wěn)定的船舶目標智能檢測,具備可靠的實用性,推動主動防船撞系統(tǒng)的技術發(fā)展.

1 ? 技術框架和研究方法

本文提出基于視頻傳感橋梁主動防撞監(jiān)測預警系統(tǒng),由視頻獲取、目標檢測、航跡跟蹤、航跡預測、風險評估、預警決策六個模塊組成,技術框架圖如圖1所示.

視頻獲取模塊通過橋載監(jiān)控攝像頭獲取視頻圖像信息,并進行圖像增強等預處理,傳入目標檢測模塊;目標檢測模塊使用預先訓練好的卷積神經(jīng)網(wǎng)絡模型檢測畫面中的船舶目標,根據(jù)空間投影關系將目標的像素坐標轉換為世界坐標,傳入航跡跟蹤模塊;航跡跟蹤模塊在時間維度上進行目標關聯(lián)形成航行軌跡,并自動檢查和去除偽航跡;航跡預測模塊將目標當前航跡輸入神經(jīng)網(wǎng)絡,輸出對目標將來航跡、抵橋時間和通過位置概率分布的預測,并通過在線學習的機制基于累積的航跡數(shù)據(jù)不斷更新神經(jīng)網(wǎng)絡模型;風險評估模塊參考航跡跟蹤和預測的結果,對船橋撞擊風險進行綜合評估;預警決策模塊根據(jù)風險評估結果做出相應的決策,如在檢測到危險的情況下對船舶進行警示和引導,在無可避免的撞擊發(fā)生前通過中止上橋方向交通等方式避免進一步的人員和財產(chǎn)損失,在撞擊發(fā)生后對橋梁狀態(tài)進行撞后評估,從而對是否通行或維修作出決策,并且對撞擊過程進行錄像取證.

目標檢測是整個防撞監(jiān)測系統(tǒng)的核心和基礎,識別準確性及穩(wěn)定性影響整個系統(tǒng)的成敗. 本文將針對航區(qū)目標檢測的特點和需求,通過模型選取、數(shù)據(jù)集建立、模型訓練和針對性優(yōu)化,研究該模塊的技術方法,為后續(xù)跟蹤預警模塊提供穩(wěn)定有效的信息支持.

2 ? 船舶目標檢測方法

2.1 ? 神經(jīng)網(wǎng)絡模型

2.1.1 ? 方法比較

目標檢測的核心任務在于找到圖像中感興趣的目標,并確定目標在圖像中的位置和大小,航區(qū)目標的檢測具有以下特點:其一是航區(qū)的背景環(huán)境通常較為復雜,波浪、光照變化、水汽、陰影倒影等均可能對目標檢測形成干擾;其二是船舶的種類繁多,外觀、大小不一而足;其三是出于預警的需求,監(jiān)測范圍較大,畫面中的遠處目標較小;其四是目標交會、重疊的情況時有發(fā)生,對圖像識別造成困擾.上述特點使得航區(qū)目標的檢測面臨其它環(huán)境下未有的挑戰(zhàn).

現(xiàn)有橋梁主動防撞視頻監(jiān)測系統(tǒng)大多采用基于運動的目標檢測方法,基本原理是提取視頻圖像序列中目標的運動特性,將運動目標與靜止背景進行分割,從而實現(xiàn)目標檢測.根據(jù)分割原理不同,常用的基于運動的目標檢測方法可分為三類:光流法[3]、幀間差分法和背景減除法[4]. 然而,基于運動的目標檢測算法的缺點顯而易見:依賴于“靜止”的背景,無法適應快速變化的背景,而航道受光照、風等的影響,其水面往往伴隨劇烈的變化;檢測出的目標僅僅是“運動”的物體,而無法甄別該物體是否為航區(qū)船舶,并且無法識別靜止的船舶;運算速度較慢,無法充分利用高分辨率監(jiān)控圖像的像素信息. 上述的缺點致使現(xiàn)有橋梁防撞視頻監(jiān)測系統(tǒng)缺乏應對復雜環(huán)境的穩(wěn)定性,智能化程度低,無法真正適應長期監(jiān)測的需求.

基于特征的目標檢測方法是另一種主流目標檢測方法,近年來隨著深度學習技術的飛速發(fā)展,逐漸開始滲透到各個應用領域,其在橋梁防撞監(jiān)測領域亦有開發(fā)前景.基于特征的目標檢測算法是對目標的顏色、輪廓等特征進行提取與判斷,從而實現(xiàn)對檢測目標的識別與定位.基于特征的目標監(jiān)測算法經(jīng)歷了依靠人工設計特征的早期模式到使用卷積神經(jīng)網(wǎng)絡進行特征提取的發(fā)展階段.傳統(tǒng)的機器學習算法基于人工設計的特征,如Haar特征、LBP特征和HOG特征[5],這種依賴先驗知識的方法面對目標多樣性物體外形往往泛化能力不足,無法滿足外觀多樣的船舶目標的檢測需求;而基于深度學習的目標檢測方法[6-8]通過訓練從龐大的數(shù)據(jù)集提取和學習特征,對物體外觀多樣性、角度、形變以及環(huán)境和光照的變化均有強大的適應能力,并且在檢測的同時能夠實現(xiàn)目標類型的智能識別,能夠較好地適應航區(qū)目標檢測的特殊性.

SSD是目前較為成熟的一種深度學習目標檢測算法,除上述優(yōu)勢外,其將特征提取、邊框回歸和分類在一個無分支的卷積網(wǎng)絡中完成,在保證精度的同時達到極高的檢測速度,能夠有效滿足航區(qū)監(jiān)測范圍大、目標數(shù)量多、檢測精度和信息處理效率要求高的需求,因此,選擇SSD作為航區(qū)目標檢測模塊的模型基礎.

2.1.2 ? SSD模型

SSD模型即Single Shot MultiBox Detector,由Wei Liu等人于2016年首次提出[9]. 相比同類型網(wǎng)

絡[10,11],其最大特點在于使用多尺度特征圖檢測,適應不同大小物體的檢測,能夠滿足航區(qū)目標尺度多樣性的需求.

SSD模型的架構如圖 2所示[9],網(wǎng)絡的主體由基礎網(wǎng)絡和附加特征網(wǎng)絡組成.圖像縮放成300×300標準尺寸后前向傳播通過基礎網(wǎng)絡;基礎網(wǎng)絡由高質(zhì)量圖像分類網(wǎng)絡的標準架構(如VGG、GoogleNet、AlexNet等)在分類層之前截斷形成,其作用是進行特征提取形成特征圖,本文以VGG-16網(wǎng)絡作為基礎網(wǎng)絡,如該圖所示;在經(jīng)過基礎網(wǎng)絡的特征提取后,進入輔助網(wǎng)絡結構,輔助特征網(wǎng)絡是一種卷積金字塔結構,各層的特征圖尺寸逐漸減小,包括基礎網(wǎng)絡的末層在內(nèi),特征圖大小從38×38到1×1不等,上述諸層通過卷積濾波器,生成目標物體框和類別的預測;最后通過非極大值抑制過濾過度重合的結果,得到最終的輸出.

卷積濾波器的工作原理如圖3所示[9],特征圖的每個像素都有不同大小和寬高比的默認框,使用卷積濾波器對特征圖每個像素默認框的位置(location)和各類別的置信度(confidence)進行預測.位置輸出有4個:(lcx,lcy,lw,lh),分別為物體框中心和寬高相對于默認框的偏移;置信度輸出有N個:(c0, c1,…,cN-1),分別為物體屬于各類別的分數(shù),其中c0為背景(負樣本)分數(shù).因此在每個特征層的輸出維度為L×L×B×(N+4),其中L為特征圖尺寸,B為每個像素默認框數(shù)量,在conv4_3層為3,其余層為6.

金字塔式的特征層結構使網(wǎng)絡能夠適應不同大小物體的檢測,如在訓練過程中,圖中小艇和大船所在的物體框分別與11×11和3×3特征圖中較小和較大的默認框相匹配,則這兩個框標記為正樣本,其余默認框為負樣本.因此,小的物體在較大的特征圖中檢測,而大的物體在較小的特征圖中檢測.多尺度特征圖檢測是SSD模型的特點與先進之處.如此,可以提高檢測結果的精度,同時還得到了不同長寬比例的檢測結果.

2.2 ? 船撞專用數(shù)據(jù)集

建立合適的數(shù)據(jù)集對SSD模型進行訓練,才能在橋梁主動防船撞系統(tǒng)中以達到預期的目標檢測效果.充分考慮到檢測模型在不同船型、視角、環(huán)境下的適應性以及特定工作場景下的針對性,訓練所用到的原始圖像數(shù)據(jù)既來自網(wǎng)絡爬取,也有現(xiàn)場采集.目標檢測任務訓練所用的目標檢測模型通常可分為兩類:一類是廣譜數(shù)據(jù)集,即涵蓋物體類別較多、數(shù)據(jù)量較大、適應多種任務的數(shù)據(jù)集,常用的包括PASCAL VOC、MS-COCO等;另一類是針對特定目標檢測任務,包含一個或多個物體類別的專用數(shù)據(jù)集.上述廣譜數(shù)據(jù)集盡管數(shù)據(jù)量大、涵蓋類別多,但在特定目標檢測且對精度要求較高的任務上,由于物體本身外觀的多樣性,往往難以達到理想的效果.因此,本文建立了用于船舶目標檢測的專用數(shù)據(jù),即船撞專用數(shù)據(jù)集(VC數(shù)據(jù)集,Vessel Collision Dataset)進行訓練.

目標檢測模型應具有普適性,這意味著模型必須適用于多船型、多角度、復雜環(huán)境下的檢測任務.因此,VC數(shù)據(jù)集的建立充分考慮了樣本涵蓋面的豐富性.為此,從網(wǎng)絡上搜集了近4萬張船舶圖片作為樣本,樣本涵蓋了包括集裝箱船、散貨船、滾裝船、帆船、小艇等在內(nèi)的多種常見船型,包含海洋、港口、內(nèi)河在內(nèi)的多種地理環(huán)境,多種拍攝角度和不同的氣候光照條件.樣本的氣候光照條件包含晴朗的白天、霧天、陰天、傍晚和黑夜,并通過算法篩選提高了其中暗環(huán)境條件樣本的比例.這是由于在自然條件下暗環(huán)境樣本的分布比例相對較少,人為提高比例可以提高該環(huán)境下的檢測性能.經(jīng)過篩選,最終共標注了3萬余張圖片,作為數(shù)據(jù)集的基礎.

為了驗證VC數(shù)據(jù)集訓練的模型效果,圖4比較了其與廣譜數(shù)據(jù)集VOC 0712訓練SSD模型的性能對比圖,共包含四幅圖. 第1幅圖為白天能見度較好情況下的檢測結果,可見上圖準確地檢測出船體的邊界,而下圖的檢測存在誤差;第2幅圖是在傍晚逆光條件下的檢測結果,上圖準確地區(qū)分了船體與陰影,而下圖的結果包含了陰影;第3幅圖是在夜間有外部光照下的檢測結果,可見上圖準確檢測出兩個目標,而下圖僅檢測出其中一個;第4張圖是在黑夜無外部光源下的結果,可見下圖未能檢測出目標,而上圖在此條件下依然保持較好的檢測效果.可以看出,基于VC數(shù)據(jù)集的SSD模型對船舶目標的檢測無論在準確性還是各環(huán)境條件下的魯棒性上均遠遠優(yōu)于基于廣譜數(shù)據(jù)集的模型檢測結果,能夠充分保證模型的普適性.

目標檢測模型應具有針對性.利用海量樣本數(shù)據(jù)建立的數(shù)據(jù)集具備適應不同條件檢測任務的普適性,但其在實際應用場景下并不一定能達到最佳.通過有針對性地加入數(shù)據(jù)量遠小于已有樣本的現(xiàn)場圖像數(shù)據(jù)到數(shù)據(jù)集,就能以較小代價使模型在實際場景下的工作性能得到顯著的提升,使模型兼具普適性和針對性. 為此,采集試驗橋梁通航區(qū)的監(jiān)測視頻,拍攝時間從白天持續(xù)到夜晚,從視頻中按一定時間間隔截取幀圖像,并對打亂順序后的圖像樣本進行標注,對已有數(shù)據(jù)集進行擴充. 為進一步提升檢測性能,將實拍樣本劃分為簡單樣本和困難樣本,如圖5所示,簡單樣本通常為單艘船舶,邊界鮮明,困難樣本包括船舶間遮擋、橋墩遮擋以及相似背景干擾等情況. 在正常分布下,簡單樣本占比較高,并且大多相似,而困難樣本較少,根據(jù)損失函數(shù)的定義,此類樣本在損失計算中所占權重相對較低,這將導致其特征不能得到充分學習,如此易導致模型在上述困難情況下表現(xiàn)不佳. 因此,通過對困難樣本減小采樣間隔、裁剪等數(shù)據(jù)增加手段,使實拍樣本集中的簡單樣本和困難樣本的比例接近0.5:0.5,從而提升模型對困難樣本的識別能力.試驗結果顯示,在基礎數(shù)據(jù)集中增加僅1/20~1/10的針對性場景擴充數(shù)據(jù),便能使模型的目標檢測能力得到顯著提升,避免了在船舶間遮擋、橋墩遮擋以及相似背景干擾等情況下的誤檢和漏檢.

數(shù)據(jù)集中樣本的涵蓋面和比例之外,標注的質(zhì)量同樣影響模型檢測的準確性. 目標檢測任務的數(shù)據(jù)標注包括了目標的邊框和類別. 對于船舶目標,影響標注質(zhì)量的因素主要有2個,如圖6所示.

其一是部分船舶上部有細長高聳的桅桿或天線,甚至高度遠超船體部分,若將其標注在內(nèi),框上部絕大部分區(qū)域為背景,而實際目標的特征極少,如此將導致模型訓練過程中引入了過多背景特征形成干擾,在實際工作中表現(xiàn)為誤警,因此在標注過程中應當舍棄過細過長的部分. 其二是目標受到部分遮擋時,若遮擋面積較大,同樣會引入過多干擾因素,使得實際工作中將障礙物誤識別為目標,因此當遮擋面積超過40%時不標注.

在SSD模型的訓練過程中.對訓練數(shù)據(jù)的圖片按照0.1至1的尺寸比例隨機裁剪,并以50%的概率隨機翻轉,使模型適應不同尺寸和外形的目標.

數(shù)據(jù)集建立后,可采用數(shù)據(jù)增強策略來提升模型對目標尺寸的適應性.將VC數(shù)據(jù)集按照8 ∶ 1 ∶ 1的比例分為訓練集、驗證集和測試集,訓練中每進行10 000次迭代使用測試集評估損失. 圖7為模型經(jīng)過80 000次迭代的損失變化曲線,可見模型在50 000次迭代后訓練集損失逐漸收斂,測試集損失在10 000次迭代后便已平穩(wěn),經(jīng)過80 000次訓練的模型在測試集上的損失收斂到0.757.

2.3 ? 航區(qū)廣域劃分方法

航區(qū)橋梁主動防撞目標檢測的一大特點和難點就是監(jiān)測范圍大,遠近目標在監(jiān)控畫面中大小懸殊,導致小目標難以識別與定位.為解決這一問題,提出航區(qū)廣域劃分方法.定義目標大小的衡量指標如下:

實測結果表明SSD模型能夠檢測λ在0.1~1間的目標,且隨著λ的降低準確率有所下降. SSD的架構決定了該模型對小目標的檢測有局限性,原因有三:其一,小物體通常在大的特征圖中檢測(如圖 3所示),但由圖 2可見,較之于小的特征層,大的特征層在網(wǎng)絡中所處層次較淺,而小物體的檢測通常需要更深層的特征,這一矛盾制約了小物體的檢測能力;其二是檢測前對圖片的縮放使得小物體原本少的特征信息被進一步壓縮,盡管SSD512相較SSD300增加了輸入圖像的尺寸,但小物體的檢測能力提升不大;其三是訓練過程中正負樣本的劃分,如圖 3所示,小物體檢測所在的特征圖中負樣本數(shù)遠大于正樣本,使得正樣本的特征未能被充分地學習.上述原因制約了SSD模型在小目標檢測上的表現(xiàn),這是檢測速度與精度妥協(xié)的結果,盡管RetinaNet[11]等提出通過改進損失函數(shù)減小正負樣本比例失衡的影響,但λ遠小于0.1時目標特征信息不足依舊是最大的制約,充分利用監(jiān)控視頻的高清圖像信息方是解決此問題的關鍵.

因此,針對橋梁主動防撞的大范圍監(jiān)測,本文提出分區(qū)域檢測方法,利用算法自動將監(jiān)測區(qū)域劃分為(m×n+1)個區(qū)域,其中靠近攝像頭且無河岸部分設為1個矩形區(qū)域,畫面中兩岸圍成的梯形區(qū)域分為m×n個區(qū)域,其中m為橫向分割數(shù),n為縱向分割數(shù),橫向寬度按下底兩岸寬度均分,縱向高度滿足:

劃分后的區(qū)域在畫面中為(m×n+1)個矩形,將矩形放大1.1~1.2倍使之相互交錯,如圖8將畫面劃分為(3×2+1)個區(qū)域,然后將各區(qū)域圖像分別輸入模型進行檢測,將檢測結果重組,對交錯區(qū)域的重合結果進行非極大值抑制,得到監(jiān)測區(qū)域的總檢測結果.各區(qū)域的相互交錯可避免區(qū)域交界處目標割裂導致的漏檢.通過上述方法,能夠使各區(qū)域船舶目標的λ保持在檢測準確率較高的區(qū)間,充分利用高分辨率圖像信息的同時將天空、河岸的無關區(qū)域舍棄,從而得到覆蓋廣大監(jiān)測范圍的、穩(wěn)定的檢測結果. 如圖9所示,近處較大的目標和遠處極小的目標能夠在同一相機視野中檢測.

航區(qū)廣域劃分方法避免了單幀輸入導致的像素丟失,使高清相機的圖像信息得到充分利用,解決了大范圍監(jiān)測下小目標的識別定位問題.

3 ? 目標檢測算法綜合評價

本文提出的船舶目標檢測算法在準確性、穩(wěn)定性、效率和智能化方面均遠優(yōu)于傳統(tǒng)防撞系統(tǒng)所采用的船舶目標檢測算法.現(xiàn)有橋梁主動防撞視頻監(jiān)測系統(tǒng)大多采用基于運動的目標檢測方法,包括幀間差分法和背景減除法,其中后者是發(fā)展最為成熟、在防撞領域使用最廣泛的方法.背景減除法的基本原理是通過統(tǒng)計學理論建立檢測場景的背景圖像,再將每一幀待檢測目標圖像與背景圖像進行差分,實現(xiàn)運動前景的檢測,并通過背景圖像的動態(tài)更新來適應動態(tài)場景的情況.以下將本文所采用的船舶目標檢測方法與該方法做了比較.

根據(jù)背景模型的不同,基于背景減除原理的目標檢測方法很多,如單高斯背景建模法、混合高斯背景建模法等[12],本文選取了ViBe算法(Visual Background Extractor,視覺背景提?。楸容^對象,該方法由Barnich等人于2009年提出[13],基于鄰域隨機取樣的背景建模方法,是目前最為先進的運動目標檢測方法之一. 如圖10所示,使用SSD和ViBe對同一段航道視頻進行處理,將船舶目標檢測效果進行比較.

由第1 s的檢測結果可以看出,ViBe能夠在第2幀就開始檢測,這是其較之于同類算法的優(yōu)勢(背景建模通常需要前若干幀),但由于水面波浪、光照等動態(tài)因素的存在,ViBe所得到的前景中存在大面積的噪聲,這直接導致了大面積的誤檢.此外,由于初始背景模型將全圖視為背景,還會導致目標移動后在其初始位置殘留鬼影[14]. 本文所提方法不存在初始化和幀間關聯(lián)的問題,從第1幀開始便可穩(wěn)定檢測.

由第30 s和第63 s的檢測結果可見,盡管通過背景的更新,噪聲面積減小,但其影響依舊存在.另外,從30 s的結果可以發(fā)現(xiàn),鬼影的影響仍然存在.噪聲和鬼影將導致背景減除法的檢測結果中存在大量誤警.值得一提的是,畫面的抖動也將導致大量噪聲的出現(xiàn). 此外,可以發(fā)現(xiàn),ViBe并不能將靜止的目標檢測出來,而對于相鄰或重疊的目標,該方法無法將其有效區(qū)分. 從檢測框的精度層面,ViBe的檢測框中不僅包含目標本身,還有目標的陰影、倒影以及噪聲,這直接影響到目標定位的精度. 另外,此類方法需要通過高斯平滑來減小噪聲的影響,這也導致了有效圖像信息的丟失,對小物體的檢測能力有限.

綜上所述,傳統(tǒng)的背景減除算法的檢測需要經(jīng)過初始化,才能進入穩(wěn)定檢測階段,并且在抗噪聲、應對物體重疊、檢測精度上均有不少局限性. 此外,傳統(tǒng)方法僅僅是機械式地區(qū)分運動物體和靜止背景,對靜止目標的檢測和運動非目標的區(qū)分無能為力.而本文所采用的基于神經(jīng)網(wǎng)絡的目標檢測方法,從第1幀開始便能夠穩(wěn)定檢測,且應對上述問題均有良好的表現(xiàn),更為精確、穩(wěn)定、智能,尤其在應對光照和水面波浪變化劇烈、橋梁振動等復雜航道監(jiān)測環(huán)境上,其優(yōu)勢顯而易見.

本文還將兩種方法的運行速度進行了比較,如圖 11所示,該對比試驗采用AMD Ryzen 7 2700X+NVIDIA GTX 1080Ti的硬件環(huán)境.神經(jīng)網(wǎng)絡運算支持GPU并行,因此SSD使用GPU+CPU運算,而ViBe僅使用CPU.由于SSD300模型的輸入大小為300×300,因此將測試視頻的圖像尺寸統(tǒng)一縮放到300×300進行處理.在該分辨率下,ViBe平均每秒所處理的幀數(shù)僅為1.76幀,而SSD300的速度達到了30.27 fps.由于本文采用了分區(qū)域檢測的方法來提高圖像信息的利用率,事實上將單幀圖像劃分為多個圖像進行處理,在按圖8劃分為7個區(qū)域進行檢測的情況下,其每秒處理的幀數(shù)也達到了8.72幀.將ViBe的輸入尺寸提高到512×512來提高像素利用率,其運行速度降低到僅0.66 fps,而檢測效果并無明顯提升.因此,在相同輸入尺度下,本方法的運行速度比傳統(tǒng)方法快395%以上,且準確度更高.

4 ? 松浦大橋航區(qū)試驗

以上海松浦大橋為背景進行了實橋航區(qū)試驗,試驗目的在于:其一,獲取實際航道的船舶圖像數(shù)據(jù),用于模型訓練;其二,優(yōu)化視頻獲取模塊的集成與布設方案;其三,量化本文提出的船舶目標檢測方法的定位精度和有效范圍;其四,為進一步的航跡預測模型的建立提供數(shù)據(jù)基礎.上海市松浦大橋為預應力連續(xù)鋼桁架結構,正橋長419.6 m,四孔,中間二孔跨徑各112 m,兩邊二孔跨徑各96 m.上層公路橋面寬12 m,其中車行道寬9 m,兩端引橋共長1 440 m,南北兩岸各22孔,跨徑32.7 m.下層鐵路橋兩端引橋共長2 628 m,橋面寬12 m,南岸38孔,北岸42孔,跨徑為32.7 m,橋位處河道寬度約400 m.

試驗步驟包括標定點的布設與測定、相機架設與調(diào)節(jié)、相機內(nèi)參標定、視頻采集燈,其中標定點的布設測定用于后期攝像機像素坐標-世界坐標的換算.如圖12所示,在3個橋墩頂部橋面處各架設1臺攝像機,拍攝航道視頻.其中#1和#3攝像機為普通網(wǎng)絡攝像機,分別用于拍攝近距離和中距離監(jiān)控區(qū)域的視頻圖像;#2為云臺攝像機,使用長焦鏡頭,用于拍攝遠距離監(jiān)控區(qū)域的視頻圖像.試驗所拍攝的視頻圖像用于船舶圖像數(shù)據(jù)集的擴充和模型訓練,以提升神經(jīng)網(wǎng)絡模型在實橋場景下的工作性能.

利用采集到的實橋監(jiān)控視頻驗證目標檢測模型在不同視角、不同光線環(huán)境下的工作性能,如圖12所示. 首先,由結果可見該模型在不同視角下均表現(xiàn)出了良好的檢測性能,能夠很好地應對船舶目標姿態(tài)多樣性的挑戰(zhàn). 其次,該視頻拍攝于秋季下午16:00~18:00間,監(jiān)測區(qū)域為橋梁西偏南方向,該時段的場景變化十分劇烈,船舶目標檢測面臨逆光、水波和日落等因素的挑戰(zhàn). 從不同時段光線條件下的檢測結果可以看出,該模型能夠實現(xiàn)正常光照環(huán)境下的船舶目標穩(wěn)定檢測,在應對強烈逆光、夜間環(huán)境光均有良好的表現(xiàn).

如圖12所示,攝像頭#1上下兩圖距橋500 m以內(nèi)各有5艘和6艘船舶,均被成功檢測,且各有2艘發(fā)生不同程度交叉的船舶,亦得到精準的區(qū)分;攝像頭#2上下兩圖中各有10艘和11艘船舶,均被成功檢測,尤其下圖中存在強烈的反射光和鏡頭抖動干擾;攝像頭#3上下兩圖中分別有13艘和10艘船舶,同樣得到精確檢測,且上圖中最近和最遠的船舶目標距離超過2 000 m,大小相差超過10倍,均能被該機位覆蓋.

試驗還對本系統(tǒng)的有效監(jiān)測范圍和定位精度進行了驗證.圖13是航跡跟蹤模塊基于本模型目標檢測結果所得到的船舶目標航跡(橋墩處圓角框為處于視野盲區(qū)的目標).有賴于使用區(qū)域劃分進行大范圍監(jiān)測優(yōu)化,使用中等焦距鏡頭的#3相機的有效監(jiān)測范圍達到了2.5 km,使得檢測方法對小物體的檢測能力不再是有效監(jiān)測范圍的制約因素,取而代之的是河道走向、視野障礙等外在因素. 此外,檢測精度的提升也為目標的精準定位提供了良好的數(shù)據(jù)基礎.

綜上,實橋試驗驗證了本文提出的主動防船撞系統(tǒng)框架中的基于深度學習的目標檢測方法,其能夠充分滿足針對橋梁主動防撞航區(qū)目標檢測各方面的需求,應對包括監(jiān)測時間長、環(huán)境復雜性高、監(jiān)測范圍大、目標外觀多變、檢測精度要求高等問題,從而為系統(tǒng)進一步的航跡跟蹤預測、防撞預警決策和航道監(jiān)控管理提供信息支持.

5 ? 結 ? 論

本文針對橋梁主動防撞視頻監(jiān)測系統(tǒng)研究了基于深度學習的航區(qū)目標檢測方法,主要進行了以下工作:選擇SSD作為航區(qū)目標檢測的模型基礎,建立神經(jīng)網(wǎng)絡模型;建立船撞專用數(shù)據(jù)集,包含35 155張船舶圖像,通過樣本選取和數(shù)據(jù)增強兼顧了模型普適性和實際工作場景下的針對性;通過航區(qū)廣域劃分方法解決小物體檢測問題,中等焦距下單目標監(jiān)測范圍達到100~2 500 m.

綜合評價結果表明,本文提出的航區(qū)目標檢測方法在各方面均較傳統(tǒng)方法有較大提升,包括:有效應對噪聲和動態(tài)背景,且無需初始化過程,全程穩(wěn)定工作;不受陰影、倒影和目標重疊影響,定位精準,且對λ小于0.02的物體亦保持較高檢測率;速度快395%以上,同時像素利用率更高;區(qū)分目標類型,減少誤檢和漏檢,智能化程度更高.

實橋試驗驗證了本文提出的基于深度學習的航區(qū)目標檢測方法能滿足航區(qū)全天候、多視角、大范圍、多目標的目標識別定位需求,為進一步的航跡跟蹤預測、防撞預警和航道監(jiān)控提供信息支持.

參考文獻

[1] ? ?陳亮,吳善剛,肖英杰,等. 基于視頻目標檢測的橋梁防船撞主動預警技術研究[J]. 水運工程,2012,(6):150—154.

CHEN L,WU S G,XIAO Y J,et al. Active forewarning technology for anti-collision between ship and bridge based on video object detection[J]. Port & Waterway Engineering,2012,(6):150—154. (In Chinese)

[2] ? ?任慧,王 瑩,肖剛,等,橋梁防船撞主動預警系統(tǒng)設計及實驗研究[J]. 激光與紅外,2013,43(1):66—70.

REN H,WANG Y,XIAO G,et al. Active early-warning system for bridge piers against ship collision and its experiment [J]. Laser & Infrared,2013,43(1):66—70. (In Chinese).

[3] ? ?LUCAS B,KANADE T. An iterative image registration technique with an application to stereo vision[C]// Proceedings of the 7th international joint conference on Artificial intelligence. Vancouver:IJCAI,1981:674—679

[4] ? ?GLOYER B,AGHAJAN H K,SIU K Y,et al. Video-based freeway-monitoring system using recursive vehicle tracking[J]. Proc Spie,1995,2421:173—180.

[5] ? ?DALAL N,TRIGGS B. Histograms of oriented gradients for human detection[C]// 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05). San Diego:IEEE,2005:886—893.

[6] ? ?REN S,HE K,GIRSHICK R,et al. Faster R-CNN:towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(6):1137—1149.

[7] ? HE K,ZHANG X,REN S,et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2015,37(9):1904—1916.

[8] ? ?GIRSHICK R. Fast R-CNN[C]// 2015 IEEE International Conference on Computer Vision (ICCV'15). Santiago:IEEE,2015:1440—1448.

[9] ? ?LIU W,ANGUELOV D,ERHAN D,et al. SSD:single shot multibox detector[C]// Proceedings of the 14th European Conference on Computer Vision. Netherlands:ECCV,2016:21—37.

[10] ?REDMON J,DIVVALA S,GRISHICK R,et al. You only look once:unified,real-time object detection[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR'16). Las Vegas:IEEE,2016:779—788.

[11] ?LIN T,GOYAL P,GRISHICK R,et al. Focal loss for dense object detection[C]// 2017 IEEE International Conference on Computer Vision (ICCV'17). Venice:IEEE Computer Society,2017:2999—3007.

[12] ?DAN D,GE L,YAN X. Identification of moving loads based on the information fusion of weigh-in-motion system and multiple camera machine vision[J]. Measurement,2019. doi:10.1016/j.measurement.2019.05.042.

[13] BARNICH O,DROOGENBROECK M. ViBe:A powerful random technique to estimate the background in video sequences[C]// Proceedings of the 2009 IEEE International Conference on Acoustics,Speech and Signal Processing. Washington D C:IEEE Computer Society,2009:945—948.

[14] ?李鵬,王延江. 一種運動背景下視覺注意輔助的目標檢測方法[J]. 湖南大學學報(自然科學版),2018,45(8):138—149.

LI P,WANG Y J. A target detection method aided with visual saliency under moving background[J]. Journal of Hunan University (Natural Sciences),2018,45(8):138—149. (In Chinese).

猜你喜歡
目標檢測視頻監(jiān)控神經(jīng)網(wǎng)絡
神經(jīng)網(wǎng)絡抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
視頻中目標檢測算法研究
軟件(2016年4期)2017-01-20 09:38:03
行為識別中的人體運動目標檢測方法
廣東地區(qū)輸電線路在線監(jiān)測技術應用探究
基于嵌入式Linux的視頻監(jiān)控系統(tǒng)的設計與實現(xiàn)
基于HTML5的視頻監(jiān)控微課設計淺析
智能視頻檢索技術在校園安防建設中的發(fā)展應用
移動機器人圖像目標識別
基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
重型機械(2016年1期)2016-03-01 03:42:04
基于P3電位的目標檢測研究
科技視界(2016年4期)2016-02-22 13:09:19
阳东县| 虹口区| 福建省| 弥勒县| 屏东市| 北辰区| 新营市| 白水县| 施甸县| 平邑县| 敦煌市| 文水县| 马关县| 大埔区| 莆田市| 泌阳县| 措勤县| 乐至县| 旬邑县| 万宁市| 敦化市| 德安县| 清水河县| 盐城市| 枣庄市| 辽宁省| 兴海县| 临颍县| 栾城县| 大田县| 康乐县| 平阴县| 宣武区| 马鞍山市| 陆良县| 凉山| 苏尼特左旗| 读书| 岗巴县| 惠来县| 桃源县|