喻 恒
(平頂山學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,河南 平頂山 467000)
視覺物聯(lián)網(wǎng)下的自習(xí)教室人數(shù)統(tǒng)計(jì)方法
喻 恒
(平頂山學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,河南 平頂山 467000)
以圖像處理技術(shù)為基礎(chǔ),提出了一套基于視覺物聯(lián)網(wǎng)框架下的人數(shù)統(tǒng)計(jì)方法。該方法利用背景差分法提取目標(biāo),再進(jìn)行圖像濾波的預(yù)處理,利用邊緣檢測(cè)和形態(tài)學(xué)算法獲得人物目標(biāo)對(duì)象的完整輪廓。通過對(duì)連通域填充和標(biāo)記來獲得精確的人數(shù),并對(duì)利用面積閾值法消除統(tǒng)計(jì)誤差進(jìn)行了討論。通過對(duì)整套算法進(jìn)行仿真實(shí)驗(yàn)分析,該方法能比較準(zhǔn)確地完成自習(xí)室中人數(shù)的統(tǒng)計(jì)。
圖像處理;邊緣檢測(cè);形態(tài)學(xué);人數(shù)統(tǒng)計(jì)
計(jì)算機(jī)視覺在人數(shù)統(tǒng)計(jì)方面的應(yīng)用目前國(guó)內(nèi)對(duì)于該項(xiàng)研究開展得較少,而國(guó)外的研究成果主要有:Terada和Yoshida[1]利用立體攝像機(jī)模擬左、右眼,通過獲得的時(shí)空?qǐng)D像來實(shí)現(xiàn)人數(shù)統(tǒng)計(jì);Beymerl[2]采用立體攝像機(jī),利用高斯混合模型跟蹤個(gè)體的狀態(tài),并進(jìn)行分類,做出判定是否計(jì)數(shù);Schofield和Stonham[3]采用單個(gè)攝像機(jī)和基于隨機(jī)存取存儲(chǔ)器(RAM)神經(jīng)網(wǎng)絡(luò)的方法實(shí)現(xiàn)人數(shù)統(tǒng)計(jì)。以上方法采用的設(shè)備成本過高,算法復(fù)雜,要求處理速度較高,不適合實(shí)際應(yīng)用中的推廣和普及。
智能視覺物聯(lián)網(wǎng)[4]是新一代信息技術(shù)的重要組成部分,視覺物聯(lián)網(wǎng)技術(shù)下的人數(shù)統(tǒng)計(jì)的難點(diǎn)就是對(duì)采集的室內(nèi)圖像進(jìn)行處理分析,得到準(zhǔn)確的人數(shù)信息。本文通過將視頻監(jiān)控圖像進(jìn)行預(yù)處理后,將目標(biāo)對(duì)象“人”進(jìn)行輪廓提取和形態(tài)學(xué)處理之后,對(duì)連通域進(jìn)行標(biāo)記統(tǒng)計(jì),并通過面積閾值糾正誤差,達(dá)到智能快速統(tǒng)計(jì)教室的人數(shù)。從而使教室人數(shù)信息能夠?qū)崟r(shí)共享,有利于學(xué)校教室人數(shù)流動(dòng)的統(tǒng)計(jì),提高學(xué)生學(xué)習(xí)效率和教室資源的利用率。
視覺物聯(lián)網(wǎng)下的人數(shù)統(tǒng)計(jì)是對(duì)教室內(nèi)通過局域網(wǎng)連接的視頻監(jiān)控器獲取的圖像進(jìn)行處理,檢測(cè)統(tǒng)計(jì)人數(shù),并通過網(wǎng)絡(luò)實(shí)時(shí)上傳統(tǒng)計(jì)數(shù)據(jù)。首先,要對(duì)圖像進(jìn)行背景差分、圖像濾波等一系列處理;其次,運(yùn)用邊緣檢測(cè)以及形態(tài)學(xué)算法進(jìn)行處理,得到圖像的輪廓,并采用面積閾值法剔除不符合要求的連通域,最終統(tǒng)計(jì)出人數(shù)(如圖1所示)。
圖1 視覺人數(shù)統(tǒng)計(jì)原理
在實(shí)際中,一般采用安放在不同角度的幾個(gè)攝像頭,多角度圖像的獲?。?],雖然可以增加目標(biāo)圖像的信息,但也增加了數(shù)據(jù)處理量以及系統(tǒng)成本。同時(shí),考慮到前方人物對(duì)象面部和衣服特征增加了圖像的信息復(fù)雜度,本文選擇安置在室內(nèi)后方的兩個(gè)不同角度的攝像頭。本文采用差分法消除背景以及光照等因素影響,通過維納濾波消除圖像的噪聲,以實(shí)現(xiàn)后續(xù)處理,提高檢測(cè)準(zhǔn)確率。
2.1背景差分
背景差分法[6]是通過將含有目標(biāo)對(duì)象的圖像與不含目標(biāo)的背景圖像相比較從而消除背景,達(dá)到對(duì)目標(biāo)對(duì)象的識(shí)別和檢測(cè)的一種方法。
本文采用直接靜態(tài)背景法。直接靜態(tài)背景法攝取沒有目標(biāo)對(duì)象的場(chǎng)景圖像作為背景圖像。先將不同季節(jié)和不同時(shí)間點(diǎn)得背景圖像保存到數(shù)據(jù)庫(kù)中,再根據(jù)測(cè)量時(shí)攝取圖像當(dāng)時(shí)的季節(jié)和時(shí)間點(diǎn)提取背景圖像,以適應(yīng)場(chǎng)景隨時(shí)間的變化。這種方法適用于靜止的背景,運(yùn)動(dòng)目標(biāo)比較少,且場(chǎng)景按照規(guī)律變化的密封環(huán)境??紤]到教室背景靜態(tài)性較好,環(huán)境基本屬于密封性的,以及算法的運(yùn)算效率,
2.2圖像濾波
普通攝像頭拍攝的圖像一般由于光源的顏色,明暗變化、表面灰塵等因素的影響會(huì)產(chǎn)生大量噪聲,所以對(duì)圖像進(jìn)行去噪、平滑的預(yù)處理十分必要。維納濾波[7]是根據(jù)最小均方誤差準(zhǔn)則實(shí)現(xiàn)的最優(yōu)化濾波,它使得原始圖像和濾波后的圖像之間的均方誤差最小,如式1:
其中為f(x,y)原始圖像,g(x,y)為濾波后圖像,得到 再找到估計(jì)值,使均方誤差
式中f'(x,y)為f(x,y)的最小二乘估計(jì)。維納濾波器對(duì)于含有高斯噪聲的圖像去噪效果不錯(cuò),本文采用維納濾波,得到了較好的效果,有利于后續(xù)的圖像處理。
評(píng)價(jià)對(duì)一副圖像進(jìn)行邊緣提取的結(jié)果,總的來說有如下標(biāo)準(zhǔn):檢測(cè)出的邊緣必須是目標(biāo)邊緣;邊緣的定位準(zhǔn)確性必須足夠好;得到的檢測(cè)邊緣最好是單像素等??紤]到實(shí)際檢測(cè)中要求,本文采取Canny算法提取目標(biāo)圖像的邊緣,再通過形態(tài)學(xué)運(yùn)算獲得完整封閉的邊緣輪廓。
3.1邊緣檢測(cè)
傳統(tǒng)的圖像邊緣提取算法包括Robert、Prewitt、Sobel、Gauss-Laplace、Canny等。其中,Canny算子[8]提出了嚴(yán)格的邊緣檢測(cè)三個(gè)標(biāo)準(zhǔn),在工程試驗(yàn)中具有信噪比優(yōu)良,定位精度高,單邊緣響應(yīng)好等優(yōu)點(diǎn),因此得到了廣泛應(yīng)用。
傳統(tǒng)Canny算子來進(jìn)行邊緣檢測(cè)的基本思想是:首先,利用二維高斯函數(shù)的任一方向上的一階方向?qū)?shù)作為噪聲濾波器進(jìn)行濾波平滑;接下來在濾波后的圖像中用有限差分近似偏微分計(jì)算梯度的幅度和方向,最后依據(jù)雙門限算法檢測(cè)和連接目標(biāo)邊緣,它能獲得較好的邊緣檢測(cè)結(jié)果的同時(shí)對(duì)噪聲進(jìn)行抑制[9]。該過程的數(shù)學(xué)表達(dá)式為:
其中σ為平滑系數(shù),其數(shù)值決定對(duì)邊緣的平滑作用和噪聲抑制程度。工程應(yīng)用一般取σ在1.2到1.8之間。Cannay算子檢測(cè)到的邊緣圖像有很多的具體細(xì)節(jié),而且邊緣是單像素,連續(xù)性相對(duì)較好,不容易出現(xiàn)邊緣斷裂,有利于后續(xù)填充。
3.2形態(tài)學(xué)處理
由邊緣圖像可以看出,基于Canny算子提取的邊緣,還是有很多細(xì)小的邊緣沒有連接上就無法進(jìn)行圖像填充。通過形態(tài)學(xué)的腐蝕和膨脹,可以消除原圖像中的微小干擾顆粒,同時(shí)邊緣不連續(xù)的地方連接起來,形成一個(gè)邊緣封閉的圖像。
膨脹[10],數(shù)學(xué)上膨脹定義為集合運(yùn)算。A被B膨脹,記為A⊕B,定義為:
其中B為具有特定幾何形狀的結(jié)構(gòu)元素。腐蝕與膨脹是兩個(gè)互逆的過程,其數(shù)學(xué)定義與膨脹相似,假設(shè)選定了結(jié)構(gòu)元素B,利用它來腐蝕圖像集合A,定義為:
根據(jù)這個(gè)原理,選取合適的結(jié)構(gòu)元素,就可以去掉圖像中不需要的小物體,也可以將那些我們想要分割開,卻又連接在一起的區(qū)域分割開來,從而得到封閉完整的輪廓。效果如圖2所示。
圖2 邊緣檢測(cè)和形態(tài)學(xué)處理
提取到完整的圖像輪廓后,通過對(duì)圖像進(jìn)行填充[11],計(jì)算連通域的面積,設(shè)計(jì)適當(dāng)?shù)拈撝?,將不符合特征要求的連通域[12]剔除,最后對(duì)連通域進(jìn)行標(biāo)記,就可以得到具體的人數(shù)。
由于輪廓填充圖中會(huì)有少量的非連通域的出現(xiàn),同時(shí)由于圖片中的存在兩人或多人遮擋重疊的問題,都會(huì)使計(jì)數(shù)統(tǒng)計(jì)出現(xiàn)錯(cuò)誤[13]。為了減少這種統(tǒng)計(jì)誤差,本算法采用了面積閾值法。本文根據(jù)經(jīng)驗(yàn)值設(shè)定閾值:T1=0.3S。S為根據(jù)攝像頭像素和角度以及經(jīng)驗(yàn)設(shè)定的面積值。剔除掉面積小于T1的連通域后,剩余連通域認(rèn)為就是目標(biāo)“人”。
同時(shí),設(shè)定面積倍數(shù)閾值N=Sx/S,Sx是某連通域面積,當(dāng)N在1.4~2.0之間,認(rèn)定為兩人,在2.0~2.6之間,認(rèn)定為三人,根據(jù)經(jīng)驗(yàn)可類推確定范圍值。通過閾值處理后就可以得到圖像中的人數(shù),同時(shí)消除因重疊造成的誤差,如圖3所示。
圖3 圖像填充和面積閾值處理效果圖
本文基于MATLAB編程,設(shè)計(jì)了圖形用戶界面(GUI),集成了算法中的每一步實(shí)現(xiàn),全面測(cè)試本文算法。本界面可直觀地看到圖像處理和人數(shù)統(tǒng)計(jì)的結(jié)果,如圖4所示。
圖4 Matlab仿真程序界面
為了驗(yàn)證本算法的可行性,在某自習(xí)室內(nèi)環(huán)境攝取了幾段連續(xù)的視頻圖像,本文是在五十人規(guī)格教室內(nèi)進(jìn)行的人數(shù)統(tǒng)計(jì),要考慮各種人數(shù)的情況,故采集分別有3人,5人,10人,20人,30人的情況,在每段視頻中隨機(jī)抽取了200幅含目標(biāo)的圖像,利用本文的算法對(duì)每幅圖像進(jìn)行了人數(shù)統(tǒng)計(jì)進(jìn)行了算法驗(yàn)證,如表1。
表1 算法分析
通過大量實(shí)驗(yàn)可以看出,超過教室人數(shù)半數(shù)以上的情況,由于會(huì)出現(xiàn)大量遮擋重疊,嚴(yán)重影響統(tǒng)計(jì)的結(jié)果。在實(shí)際應(yīng)用中,利用不同角度的兩個(gè)攝像頭,取計(jì)算數(shù)較大的一個(gè)結(jié)果,可降低這種因素影響,同時(shí)自習(xí)教室中學(xué)生座位比較分散,遮擋重疊現(xiàn)象不多,人數(shù)一般情況也在25人以下,因此本文算法在統(tǒng)計(jì)自習(xí)室人數(shù)方面可以獲得滿意的結(jié)果。
本文在視覺物聯(lián)網(wǎng)技術(shù)框架下,綜合應(yīng)用各種圖像處理技術(shù)實(shí)現(xiàn)了自習(xí)室人數(shù)的智能統(tǒng)計(jì)。該方法是基于教室中視頻攝像頭獲得原始圖像,再對(duì)原始圖像的進(jìn)行增強(qiáng)濾波等處理,利用邊緣檢測(cè),形態(tài)學(xué)等一系列方法獲得了封閉的連通域,通過對(duì)連通域的標(biāo)記,得到精確的人數(shù)。由于實(shí)際情況的復(fù)雜性和算法本身的理論局限性,在人數(shù)較多的時(shí)候,本方法的計(jì)數(shù)結(jié)果也會(huì)有誤差,但本文涉及的研究對(duì)象主要是自習(xí)教室,本身室內(nèi)人數(shù)相對(duì)較少,而且比較分散,重疊造成的誤差影響不大,在實(shí)際應(yīng)用中幾乎沒有增加現(xiàn)有成本,算法時(shí)效性比較好,能得到比較滿意的結(jié)果。
主要參考文獻(xiàn)
[1]K Terada,D Yoshda,S Oe,eta1.A Counting Method of the Number of Passing PeopleUsing Astereo Camera[J].Industrial Electronics Society,1999(3):1318-1323.
[2]D Beymer.person counting using stero [C]//ttoceedings Human Workshopon,Motion.Los Alamitos CA,:IEEE,2000:127-133.
[3]A J Schofidld,T J Stonham,P A Mthta. A RAM Based Neural Network Approach to People Counting[C]//Fifth International Conference on Image Processing and its Applications,Edinburgh,UK:IEEE,1995:652-656.
[4]周志勇.利用智能視覺物聯(lián)網(wǎng)構(gòu)建機(jī)場(chǎng)周界報(bào)警系統(tǒng)[J].中國(guó)公共安全:綜合版,2012(13):162-165.
[5]李健.運(yùn)動(dòng)目標(biāo)的獲取、傳輸與跟蹤[D].南京:南京理工大學(xué),2008.
[6]吳青青,許廷發(fā),閆輝,等.復(fù)雜背景下的顏色分離背景差分目標(biāo)檢測(cè)方法[J].兵工學(xué)報(bào),2013,34(4):501-506.
[7]朱立新,楊擴(kuò),秦加合.一種新的基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)模糊推理系統(tǒng)的圖像濾波器[J].計(jì)算機(jī)科學(xué),2014,41(z1):211-214.
[8]J Canny . A Computational Approach to Edge Detection[J].Pattern Analysis and Machine Intelligence IEEE Trans on,1986,8(6):679-698.
[9]喻恒,趙建軍.基于數(shù)字圖像的實(shí)體黃河模型河勢(shì)寬度檢測(cè)[J].河南大學(xué)學(xué)報(bào):自然科學(xué)版,2011,41(2):188-192.
[10]C R Gonzalez,E Woods. Digital Image Processing[M].2nd. ed.Beijing: Electronic Industry Press,2003:70-81,463-474.
[11]王曉,唐洪鵬,周麗雅.圖像處理在客流檢測(cè)中的算法研究[J].中國(guó)海洋大學(xué)學(xué)報(bào):自然科學(xué)版,2010,40(6):161-166..
[12]孔斌.快速連通域分析算法及其實(shí)現(xiàn)[J].模式識(shí)別與人工智能,2003,16(1):110-115.
[13]于麗梅.視覺物聯(lián)網(wǎng)下智能公交客流采集統(tǒng)計(jì)方法仿真[J].計(jì)算機(jī)仿真,2014,31(6):187-190.
10.3969/j.issn.1673-0194.2015.02.168
TP391.41
A
1673-0194(2015)02-0235-03
2014-12-22