陳向奎,康 牧
(洛陽(yáng)師范學(xué)院信息技術(shù)學(xué)院,河南 洛陽(yáng)471022)
隨著社會(huì)經(jīng)濟(jì)的發(fā)展,環(huán)境問(wèn)題越來(lái)越突出,海洋中蘊(yùn)含著各式各樣的資源,如石油、天然氣等,海洋成為另一個(gè)可開(kāi)發(fā)空間,如何均衡有限的海洋資源與人類(lèi)的關(guān)系是社會(huì)可持續(xù)發(fā)展的一個(gè)重要研究課題。
海洋環(huán)境中對(duì)船舶進(jìn)行識(shí)別跟蹤能夠掌控船舶的安全生產(chǎn)和對(duì)環(huán)境的影響。自從19 世紀(jì)40年代提出關(guān)于神經(jīng)元的數(shù)學(xué)模型后,人工神經(jīng)網(wǎng)絡(luò)[1]有了突飛猛進(jìn)的發(fā)展,并且具有大規(guī)模并行、分布式處理、自組織、自學(xué)習(xí)的優(yōu)點(diǎn),從而被廣泛的應(yīng)用于語(yǔ)音識(shí)別、人臉識(shí)別、表情識(shí)別等方面[2]。本文利用BP神經(jīng)網(wǎng)絡(luò)抗干擾性強(qiáng)、識(shí)別精準(zhǔn)等優(yōu)點(diǎn)對(duì)船舶進(jìn)行識(shí)別跟蹤。首先獲取原始圖像,然后進(jìn)行預(yù)處理,分別以圖像的全部灰度值為訓(xùn)練樣本和以新不變矩特征向量為樣本集輸入到3 層BP神經(jīng)網(wǎng)絡(luò)中,對(duì)含不同噪聲均值的圖像進(jìn)行識(shí)別,實(shí)驗(yàn)結(jié)果表明以新不變矩特征向量作為樣本集時(shí)抗噪能力強(qiáng),識(shí)別率高。最后以新不變矩特征向量作為樣本集進(jìn)行目標(biāo)跟蹤得到跟蹤誤差。
利用捕捉設(shè)備獲取被識(shí)別船舶的圖像,將獲取到的圖像進(jìn)行圖像處理,包括圖像灰度化進(jìn)行圖像增強(qiáng),圖像閾值分割,將圖像與背景進(jìn)行分離,便于后續(xù)的特征提取。利用不變矩進(jìn)行特征提取,優(yōu)先是此方法不受位置、方位、大小的影響,提取的特征向量能穩(wěn)定地反映提取目標(biāo)。最后利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)識(shí)別。
圖1 識(shí)別流程圖Fig.1 Recognition flowchart
通過(guò)攝像頭捕捉運(yùn)動(dòng)畫(huà)面,通過(guò)監(jiān)視器查看攝像機(jī)捕捉到的圖像,然后通過(guò)圖像增強(qiáng)、圖像校正對(duì)采集到的圖像進(jìn)行噪聲抑制和干擾剔除,提高圖像的質(zhì)量和對(duì)比度,然后進(jìn)行一系列圖像信號(hào)處理和模式識(shí)別得到目標(biāo)的位置,對(duì)已定位的目標(biāo)進(jìn)行跟蹤,調(diào)整其位置偏差,最后將此值傳送給伺機(jī)機(jī)構(gòu)進(jìn)行處理,實(shí)現(xiàn)目標(biāo)跟蹤。
圖2 跟蹤流程圖Fig.2 Tracking flowchart
BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)有輸入節(jié)點(diǎn)、輸出節(jié)點(diǎn)和隱節(jié)點(diǎn)組成。本文選用僅含1 層隱節(jié)點(diǎn)的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖3所示。
圖3 中,i 為第i 層輸入;j 為第j 層隱層;k 為第k 層輸出;輸入節(jié)點(diǎn)為圖像每個(gè)特征值所對(duì)應(yīng)的特征向量;輸出節(jié)點(diǎn)為經(jīng)過(guò)分類(lèi)器分類(lèi)后所屬于的類(lèi)別。
圖3 BP神經(jīng)網(wǎng)絡(luò)Fig.3 BP neural network
利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像識(shí)別跟蹤實(shí)質(zhì)上是信號(hào)的傳播,類(lèi)似于人體神經(jīng)的工作進(jìn)程,信號(hào)的傳遞歸納如圖4所示。
圖4 BP神經(jīng)網(wǎng)絡(luò)正反信號(hào)傳播Fig.4 Positive and negative signal propagation of BP neural network
設(shè)BP神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元,輸入層里共m個(gè),輸出層里共n個(gè),隱層里共p個(gè),神經(jīng)網(wǎng)絡(luò)中待訓(xùn)練樣本個(gè)數(shù)為N 對(duì),因此可得到神經(jīng)網(wǎng)絡(luò)中輸入、輸出為:
輸入層輸入
理想情況下輸出向量
經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)計(jì)算后得到的實(shí)際輸出
隱層的加權(quán)向量
隱層的輸出向量
輸出層的加權(quán)向量
式中:wij為輸入層與隱層之間的關(guān)系;vjt為隱層與輸出層之間的關(guān)系;θj為隱層各節(jié)點(diǎn)的最大值;ri為輸出層各節(jié)點(diǎn)的最大值。
采用Sigmoid 型函數(shù)[4]作為層與層之間的傳輸函數(shù),兩邊求導(dǎo)可得:
輸入與輸出之間的關(guān)系為:
因此得:
故得:
第k 對(duì)樣本(Xk,Yk)理想輸出值與實(shí)際輸出值之間的差為:
差值總和為:
輸出的校正誤差為:
由式(1)知:
隱層的校正誤差為:
全局誤差對(duì)輸入層和隱層連接權(quán)和最大值的負(fù)梯度為:
根據(jù)梯度下降原則,得:
式中:0 < α < 1,0 < β < 1;i=1,2,…,m;t=1,2,…,n;j=1,2,…,p。
從而得到調(diào)整后的輸入層和隱層連接權(quán)和最大值:
因而,通過(guò)上述推理得到BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程如下:
1)初始化網(wǎng)絡(luò)參數(shù),即為wij,vjt,θj,rt賦予初值。
2)在輸入層輸入需要識(shí)別的樣本(X1,Y1)。
3)通過(guò)輸入樣本、輸入層與隱層之間的關(guān)系以及最大值計(jì)算出隱層的輸出值:bt=f(st),其中st=+ θi,j=1,2,…,p。
4)計(jì)算輸出層的輸出:ot=f(lt),其中l(wèi)t=+ ri,t=1,2,…,n。
5)計(jì)算輸出層各個(gè)節(jié)點(diǎn)之間的校正差值:dt=ot·(1- ot)·(yt- ot),t=1,2,…,n。
6)計(jì)算隱層各個(gè)節(jié)點(diǎn)的校正差值:ej=bj·(1-bj)(1-ot)·(yt-ot)·vjt,t=1,2,…,n。
7)計(jì)算隱層到輸出層的新連接值:vjt(L+ 1)=vjt(L)+ αdtbjrt(L+1)=rt(L)+ αdt。
8)計(jì)算輸入層到隱層的新連接值:wij(L+1)=wij(L)+ βejxi,θj(L+1)=θj(L)+ βej。
9)然后進(jìn)行下一組樣本的訓(xùn)練,直至所有的樣本訓(xùn)練完成,不斷調(diào)整連接權(quán)值和閾值,通過(guò)輸出層得到輸出值。
本文將輸入的圖像對(duì)為16 ×16,訓(xùn)練集和測(cè)試集由每幅圖像總的像素向量組成。選用的神經(jīng)網(wǎng)絡(luò)由1 層輸入層、1 層隱層和1 層輸出層組成。輸入層的節(jié)點(diǎn)數(shù)為16 ×16,輸出節(jié)點(diǎn)為4,根據(jù)參考文獻(xiàn)[5],隱層節(jié)點(diǎn)為11,測(cè)試不同噪聲級(jí)別樣本圖像的識(shí)別率如表1所示。
表1 不同噪聲級(jí)別樣本圖像的識(shí)別率Tab.1 Recognition rate of different noise
從表1 可看出,隨著噪聲的增大,識(shí)別率會(huì)越來(lái)越低,說(shuō)明抗噪能力差。
將新不變矩特征[5]作為樣本集,測(cè)試不同噪聲級(jí)別樣本圖像的識(shí)別率如表2所示。
表2 不同噪聲級(jí)別樣本圖像的識(shí)別率Tab.2 Recognition rate of different noise
由表1和表2對(duì)比可知,在采用3 層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別時(shí),以新不變矩特征向量作為樣本集時(shí)抗噪能力強(qiáng),識(shí)別率高。
本文以新不變矩特征向量作為訓(xùn)練圖像進(jìn)行跟蹤,得到的識(shí)別誤差曲線(xiàn)如圖5所示。
圖5 識(shí)別誤差曲線(xiàn)Fig.5 The recognition error curve
隨著時(shí)間的增長(zhǎng),BP神經(jīng)網(wǎng)絡(luò)收斂,誤差越來(lái)越小,跟蹤效果越好。
本文通過(guò)對(duì)獲取的原始圖像分別以圖像的全部灰度值為訓(xùn)練樣本和以新不變矩特征向量為樣本集輸入到3 層BP神經(jīng)網(wǎng)絡(luò)中,對(duì)含不同噪聲均值的圖像進(jìn)行識(shí)別。結(jié)果表明,以新不變矩特征向量作為樣本集時(shí)抗噪能力強(qiáng),識(shí)別率高。最后以新不變矩特征向量作為樣本集進(jìn)行目標(biāo)跟蹤得到跟蹤誤差。
[1]WANG Yong-qing.Principles and methods of artificial intelligence[M].Xi'an Jiaotong University Press,2002:385-387.
[2]RAFAEL M,ABDELLAH E F.Multilayer neural networks:an experimental evaluation of on-line training methods[J].Computers & Operations Research,2004,31:1491-1513.
[3]JIAO Li-cheng.Neural network theory[M].Xidian University Press,1995.
[4]ZHAO Kuang-suo,LIN Jun-qing.Recognition of ship noise based on neural network[J].Ship Science and Technology,1995,11(6):32-36.
[5]CHANG Hua.Research on underwater target recognition based on BP neural networks[D].Northeastern University,2010.