簡夏 劉軍清
【摘 要】雙頻識(shí)別聲納(DIDSON)可以在黑暗渾濁的水下獲得清晰的視頻影像。對(duì)雙頻識(shí)別聲納的魚群視頻進(jìn)行基于智能視覺的魚群數(shù)量統(tǒng)計(jì),可高效、準(zhǔn)確的評(píng)估該水域的漁業(yè)資源[1]。提出了一種簡單可靠的統(tǒng)計(jì)方法:首先通過改進(jìn)的目標(biāo)檢測算法檢測魚體并統(tǒng)計(jì)每幀魚體數(shù)量;其次將視頻分成多個(gè)部分并對(duì)各部分的魚體數(shù)量進(jìn)行統(tǒng)計(jì);最后將各個(gè)部分的統(tǒng)計(jì)值累計(jì)得到整個(gè)圖像序列的魚群數(shù)量。實(shí)驗(yàn)結(jié)果表明本文提出的魚群數(shù)量統(tǒng)計(jì)結(jié)果比DIDSON二次開發(fā)軟件的統(tǒng)計(jì)結(jié)果更準(zhǔn)確,且滿足實(shí)時(shí)性需求。
【關(guān)鍵詞】雙頻識(shí)別聲納;魚群檢測;鬼影抑制;背景差分
【Abstract】The dual-frequency identification sonar (DIDSON) can get clear videos from cloudy and dark underwater. Useing intelligent visual statistics can be efficient and accurate assessment of fishery resources in the waters.In this paper,we propose a simple and reliable statistical methods: first, via algorithm of improved target detection to detect fishes; next, dividing the video into multiple parts, and count the number of fish in every parts, finally accumulate every parts statistics to the entire image sequence. Experimental results show that the proposed statistical methods has a out-standing advantage in counting fish.
【Key words】Dual-frequency identification sonar; Fish detection; Ghosting suppression; Background subtraction
0 前言
聲納視覺感知屬于計(jì)算機(jī)視覺和人工智能的重要分支,在水下潛水器系統(tǒng)中具有不可替代的作用。近年來,水下聲納技術(shù)被廣泛應(yīng)用到魚群探測、資源勘探、水下管道探測以及水底天然氣監(jiān)測等領(lǐng)域。聲納圖像由于聲信息傳輸?shù)膹?fù)雜性,在多數(shù)情況下目標(biāo)信息會(huì)淹沒在信道、背景等噪聲中。隨著信息技術(shù)的飛速發(fā)展,聲納數(shù)據(jù)處理的方法也隨著科學(xué)技術(shù)的發(fā)展而不斷改進(jìn)。魚群統(tǒng)計(jì)對(duì)于水下養(yǎng)殖以及珍貴魚類保護(hù)具有重要的應(yīng)用價(jià)[2-3]。2003年Moursud[4]等利用雙頻識(shí)別聲納觀測了魚群游過水電站魚道的情況,2004年Maxwell[5]等驗(yàn)證了用雙頻識(shí)別聲納在渾濁水域中評(píng)估洄游大馬哈魚的數(shù)量,2006年Everitt[6]等利用雙頻識(shí)別聲納對(duì)密蘇里河漁業(yè)進(jìn)行管理。Han[7]等用雙頻識(shí)別聲納做了洄游魚類以及養(yǎng)殖的大型魚類的尾數(shù)、體長自動(dòng)計(jì)數(shù)、測量的研究,能夠自動(dòng)精確地計(jì)算出魚的尾數(shù)和體長。董劍鋒[8-9]等對(duì)雙頻識(shí)別聲納圖像處理進(jìn)行了初步研究,并運(yùn)用到香魚計(jì)數(shù)上。上述方法主要是針對(duì)魚群進(jìn)行大致的統(tǒng)計(jì)分析,缺乏較為準(zhǔn)確的定量分析。已有研究表明,利用DIDSON視頻進(jìn)行魚群各種應(yīng)用,其關(guān)鍵是魚群檢測方法的精度[10]。
1 傳統(tǒng)目標(biāo)檢測算法魚群檢測結(jié)果
與光學(xué)圖像相比,聲納圖像本身的信息小于隨機(jī)噪聲信息,因此將光學(xué)圖像的目標(biāo)檢測算法直接應(yīng)用于聲納圖像目標(biāo)檢測時(shí)效果不理想。圖1分別為幀間差模型、平均背景法模型、高斯混合模型、CodeBook背景模型、背景差分法直接用于聲納圖像目標(biāo)檢測的效果圖。
由圖可知,由于聲納圖像隨機(jī)高斯噪聲含量大,幀間差模型檢測結(jié)果最差;平均背景模型、高斯混合模型和CodeBool背景模型的檢測結(jié)果含有大量孤立噪聲點(diǎn)且魚體輪廓含有大量毛刺;背景差分法檢測結(jié)果中含有鬼影。
2 本文魚群檢測算法
本文充分利用聲納圖像噪聲特性和魚體亮度統(tǒng)計(jì)特性,在背景差分法基礎(chǔ)上提出了一種DIDSON魚群目標(biāo)檢測及鬼影抑制方法。具體思路:首先采用背景差分法初步尋找可能出現(xiàn)的魚體目標(biāo)點(diǎn);利用聲納特性,對(duì)初步檢測的魚體目標(biāo)點(diǎn)進(jìn)行鬼影判斷去除鬼影;最后采用形態(tài)學(xué)開閉運(yùn)算去除孤立噪聲點(diǎn)。
2.1 背景差分理論
背景差分工作原理:設(shè)背景模型為M(x)={v1, v2, …, vN},其中N個(gè)樣本值均為已被判斷為背景的像素值。記v(x)為x點(diǎn)處的像素值,設(shè)定閾值R,計(jì)算{v(x)-R, v(x)+R}區(qū)間內(nèi)與樣本模型M(x)相交的樣本值個(gè)數(shù),若數(shù)值大于預(yù)設(shè)的某個(gè)最小值,則將當(dāng)前像素點(diǎn)x的像素值v(x)判斷為背景,否則為前景。
初始化:利用相近像素點(diǎn)具有相近的時(shí)空分布特性,用一幀圖像填充樣本集。其優(yōu)點(diǎn)在于:對(duì)噪聲比較靈敏、計(jì)算量小、速度快,可以很快的進(jìn)行運(yùn)動(dòng)物體檢測。更新策略:每一個(gè)背景點(diǎn)有1/φ的概率更新背景模型樣本集,同時(shí)也有1/φ的概率去更新其它的鄰居點(diǎn)的背景模型樣本集。當(dāng)前景點(diǎn)計(jì)數(shù)達(dá)到臨界值時(shí),將其變?yōu)楸尘?,并?/φ的概率背景模型樣本值。
由于背景差分采用一幀建模,如果模型初始化時(shí)出現(xiàn)目標(biāo),會(huì)將前景目標(biāo)點(diǎn)誤判為背景。當(dāng)前景目標(biāo)點(diǎn)離開后,當(dāng)前像素值無法與背景樣本集匹配,導(dǎo)致背景像素點(diǎn)被錯(cuò)誤地檢測為前景點(diǎn)形成鬼影,嚴(yán)重影響后續(xù)的跟蹤或識(shí)別。
2.2 鬼影抑制
通過對(duì)DIDSON數(shù)據(jù)圖像的特性分析可知聲納圖像中的魚體目標(biāo)屬于高亮區(qū)域,且背景區(qū)域中僅有少量的波紋信息是屬于高亮區(qū)域的。因此本文基于此特性提出了鬼影抑制方法。其基本思想:對(duì)已預(yù)處理的視頻采用背景差分法初步尋找出當(dāng)前幀中的前景目標(biāo);然后對(duì)這些前目標(biāo)景的像素值作進(jìn)一步判斷,若此像素點(diǎn)的像素值大于閾值T,即判斷為前景,否則認(rèn)為是鬼影并判斷為背景,同時(shí)更新背景模型。
2.3 實(shí)驗(yàn)結(jié)果分析
本實(shí)驗(yàn)將本文的目標(biāo)檢測方法與其它經(jīng)典檢測算法,針對(duì)小魚群和大魚群檢測性能進(jìn)行對(duì)比分析。實(shí)驗(yàn)環(huán)境配置為matlab2009a,內(nèi)存8GB,處理器為Intel Core i5-3470 3.20GHz、聲納視頻幀率為8 fps。大魚群檢測結(jié)果如圖2所示。
如圖2,CodeBook算法檢測出的目標(biāo)邊緣模糊,且存在大量的誤檢像素。背景差分法存在嚴(yán)重的鬼影現(xiàn)象(圖2中第3行白色橢圓標(biāo)記的魚體為鬼影),鬼影在第139幀以后也未消失。而本文提出的算法在第28幀之前,鬼影已消失,整體檢測性能明顯優(yōu)于CodeBook算法和背景差分算法。同時(shí)本文算法在魚體較小的情況下,其檢測效果同樣較好。
3 魚群數(shù)量統(tǒng)計(jì)
3.1 魚群數(shù)量統(tǒng)計(jì)方法
本文單幀魚群數(shù)量統(tǒng)計(jì)流程:魚群目標(biāo)檢測后的圖像中任然還有一個(gè)小面積的連通域,這些小面積的連通域并不是魚體而是一些干擾物,因此在進(jìn)行單幀數(shù)量統(tǒng)計(jì)之前需要消除面積較小的連通域。首先去除面積較小的連通域,然后統(tǒng)計(jì)這一幀圖像中連通區(qū)域的個(gè)數(shù),既可以得到一幀中的魚體個(gè)數(shù)。
從圖中可以看出,本文算法對(duì)單幀魚體數(shù)量統(tǒng)計(jì)基本準(zhǔn)確,但是對(duì)于即將消失的魚體和即將出現(xiàn)在聲納視野中的魚體檢測結(jié)果較差、不夠精確。由于將消失的魚體其回波較弱,在圖像上反應(yīng)忽明忽暗,容易被漏檢。其次大魚在游動(dòng)的過程中會(huì)產(chǎn)生大量水波,劇烈的水波也會(huì)被誤檢成魚體。
采用本文所示方法對(duì)many fish.avi圖像序列進(jìn)行魚群數(shù)量統(tǒng)計(jì),整個(gè)視頻一共有162幀,目測整個(gè)圖像序列一共游過了16條魚。通過本文的檢測結(jié)果N=16,其中m取得40;通過DIDSON二次開發(fā)軟件檢測的結(jié)果如圖4所示;本文單幀檢測結(jié)果見表1。
如圖4所示,DIDSON二次開發(fā)軟件檢測出的魚群數(shù)量為9。通過本文算法檢測出的魚體數(shù)量為16,與DIDSON二次開發(fā)軟件檢測的結(jié)果更準(zhǔn)確。其中表1 展示了本文算法在many fish.avi圖像序列從第1幀到第27幀的單幀檢測結(jié)果。
采用本文提出的方法對(duì)Kenai3-12manyfishnoshad.avi圖像序列進(jìn)行魚群數(shù)量統(tǒng)計(jì),整個(gè)視頻一共有790幀,目測整個(gè)圖像序列一共游過了87條魚。通過本文的檢測結(jié)果N=72條,其中m取得40;通過DIDSON二次開發(fā)軟件檢測的結(jié)果如圖5所示。
如圖5所示,DIDSON二次開發(fā)軟件統(tǒng)計(jì)的魚群數(shù)量為42條。由此可以看出DIDSON二次開發(fā)軟件在對(duì)體長較小的魚統(tǒng)計(jì)數(shù)量效果較差。本文的統(tǒng)計(jì)結(jié)果更接近真實(shí)結(jié)果。
4 結(jié)論
由于聲納圖像的含有大量噪聲信息,采用光學(xué)圖像的目標(biāo)檢測算法不能滿足聲納圖像目標(biāo)檢測的要求。針對(duì)這個(gè)問題,本文提出的目標(biāo)檢測方法在保留背景差分法優(yōu)勢的同時(shí)能快速抑制鬼影。其次再魚群統(tǒng)計(jì)算法上,本文提出了一種簡單的統(tǒng)計(jì)方法:在基于精確的魚群檢測上,統(tǒng)計(jì)魚群數(shù)量;實(shí)驗(yàn)結(jié)果表明,本文提出的魚群數(shù)量統(tǒng)計(jì)結(jié)果比DIDSON二次開發(fā)軟件的統(tǒng)計(jì)結(jié)果更準(zhǔn)確,且滿足實(shí)時(shí)性需求。
【參考文獻(xiàn)】
[1]張進(jìn).基于雙頻識(shí)別聲納DIDSON的魚群定量評(píng)估技術(shù)[D].上海:上海海洋大學(xué),2012.
[2]SHEN W, YANG L, ZHANG J, et al. The survey of fishery resources and spatial distribution using DIDSON imaging sonar data [C]//IFIP 2013: International conference on the Advances in Information and Communication Technology. New York, US: Springer Press, 2013: 366-375
[3]譚細(xì)暢,史建全,張宏.EY60回聲探測儀在青海湖魚類資源量評(píng)估中的應(yīng)用[J].湖泊科學(xué),2009,21(6):865-872.
[4]Melvin,G, Li. Y. Mayer,L and Clay,A. The development of an automated sounder soanr acoustic logging system for deployment on commercial fishing vessel[Z].ICES CM,1998:14.
[5]Misund,O.A.Aglen,Aand Fronaes,E.Mapping the shape,size (下轉(zhuǎn)第86頁)(上接第13頁)and density of fishs chools by echo integration and a high-resolution sonar[J]. ICES J. Mar. Sci,1995,52:11-20.
[6]Maxwell,S.and Gove,N.The Feasibility of Estimating Migrating Salmon Passage Rates in Turbid Rivers using a Dual-Frequency Identification Sonar (DIDSON).Regional Information Report No.2A04-05[R].Alaska Department of Fish and Game,March 2004.
[7]Everitt,D.Adams,J.and Mestl,G.Using DIDSON technology to observe the ecology and behavior of Missouri River fishes[C]//Proceedings of the 67th Midwest Fish and Wildlife Conference.Omaha.Nebraska,Dec 6-10,2006.
[8]童劍鋒,韓軍,沈蔚.聲學(xué)攝像儀圖像處理的初步研究及在漁業(yè)上的應(yīng)用[J].湖南農(nóng)業(yè)科學(xué),2010,17.
[9]童劍鋒,韓軍,淺田昭,溝口雅彥.基于聲學(xué)攝像儀的溯河洄游幼香魚計(jì)數(shù)[J].漁業(yè)現(xiàn)代化,2009,36.
[10]AYKIN M D, NEGAHDARIPOUR S. Forward-look 2-D sonar image formation and 3-D reconstruction [C]// IEEE Oceans Conference. San Diego, IEEE Press, 2013:23-27.
[責(zé)任編輯:湯靜]